Log doorsturen: ander (handmatig uploaden) log-forwarding-other

De Andere BYOCDN leveringsmethode is een catch-all optie voor klanten die CDN logboeken aan LLM Optimizer willen verstrekken wanneer:

  • Hand uploadt heeft de voorkeur - bijvoorbeeld, voeren de operationele teams logboeken uit en uploaden hen periodiek.
  • Ad hoc geautomatiseerde processen worden gebruikt - eenmalig manuscripten, geplande uitvoer, serverless banen.
  • De klant gebruikt a CDN die niet door het ingebouwde logboek door:sturen integratie wordt gesteund.

Deze methode imiteert het "ononderbroken door:sturen"model: stammen worden geproduceerd en in de verwachte plaats geupload S3 en uiteindelijk automatisch door de innamepijpleidingen verwerkt.

Stap 1: Aan boord in LLM Optimizer step-1

Op ​ LLM Optimizer ​:

  1. Ga naar Configuratie.

    ​ knoop van de Configuratie ​

  2. Klik de CDN Configuratie tabel.

    ​ CDN het lusje van de Configuratie ​

  3. Klik krijgen Begonnen.

  4. Naast activeer AI de Inzichten van het Verkeer, klik vormen.

    ​ vormen ​

  5. Selecteer Andere.

    ​ Uitgezochte Andere ​

  6. Klik Onboard.

Stap 2: Logboeken voorbereiden en uploaden step-2

Vereiste logbestandsindeling (JSON Lines) log-format

De logboeken moeten als nieuwe lijn worden geupload afgebakend JSON (één voorwerp JSON per lijn). Elke logboeklijn moet de volgende gebieden precies zoals hieronder gespeld omvatten.

Veld-voor-veld schema schema

Veld
Type
Beschrijving
Voorbeeld
timestamp
String
Tijdstempel van het verzoek na het formaat ISO 8601.
"2025-02-01T23:00:05Z"
gastheer
String
Het webdomein dat de client heeft aangevraagd.
"www.example.com"
url
String
De weg en de vraagparameters worden vereist, terwijl het domein niet zou moeten worden omvat.
"/home?utm_source=google"
request_method
String
De HTTP-aanvraagmethode, ook wel HTTP-werkwoorden genoemd.
"GET"
request_user_agent
String
De HTTP Gebruiker-Agent verzoekkopbal.
"Mozilla/5.0 (compatible; GPTBot/1.0"
request_referer
String
De HTTP Referer request header (kan leeg zijn).
"https://chatgpt.com"
response_status
Geheel
De statuscode van het HTTP-antwoord.
200
response_content_type
String
De HTTP Content-Type response header.
"text/html; charset=utf-8"
time_to_first_byte
Geheel
De tijd tussen het creëren van een verbinding aan de server en het downloaden van de inhoud van een Web-pagina in milliseconden. Instellen op nul indien onbekend of niet beschikbaar.
42

Voorbeelden van logboekregels example

In het volgende voorbeeld worden drie logregels getoond:

{"timestamp":"2025-02-01T23:06:14Z","host":"www.example.com","url":"/products/llm-optimizer?utm_source=google","request_method":"GET","request_user_agent":"Mozilla/5.0 (compatible; GPTBot/1.0; +https://openai.com/gptbot)","response_status":200,"request_referer":"","response_content_type":"text/html; charset=utf-8","time_to_first_byte":198}
{"timestamp":"2025-02-01T23:19:32Z","host":"www.example.com","url":"/services/ai-consulting/overview","request_method":"GET","request_user_agent":"PerplexityBot/1.0 (+https://www.perplexity.ai/perplexitybot)","response_status":200,"request_referer":"","response_content_type":"text/html; charset=utf-8","time_to_first_byte":255}
{"timestamp":"2025-02-01T23:44:05Z","host":"www.example.com","url":"/products/pricing/enterprise?utm_medium=social","request_method":"GET","request_user_agent":"ClaudeBot/1.0 (+https://www.anthropic.com)","response_status":200,"request_referer":"","response_content_type":"application/pdf","time_to_first_byte":312}

Kritische disclaimer (spelling en typen) disclaimer

De opname en samenvoegingspijpleidingen zijn strikt over gebiedsnamen en gegevenstypes.

  • De namen van het gebied moeten precies (geval en spelling) aanpassen.

  • Gegevenstypen moeten correct zijn, en wel als volgt:

    • timestamp moet een koord met formaat zijn ISO 8601. UNIX-achtige tijdstempels werken mogelijk niet.
    • response_status moet een geheel zijn.
    • time_to_first_byte moet een geheel zijn en milliseconden gebruiken.
    • Tekenreeksen moeten geldige JSON-tekenreeksen zijn.
  • Onjuist gevormde JSON- of ontbrekende/onjuiste velden kunnen ertoe leiden dat logbestanden worden overgeslagen of niet worden geparseerd, waardoor gegevens in de rapporten ontbreken.

Locatie en verwerkingscapaciteit uploaden upload-location

Padregel path-rule

Upload logbestanden via het juiste mappad met de notatie: yyyy/mm/dd/ (met schuine strepen).

Een voorbeeldlogboek van 1 februari 2025 UTC: ABC123AdobeOrg/raw/byocdn-other/2025/02/01/

Verwerkingsregel processing-rule

  • Logboeken die tijdens een bepaalde UTC dag worden geupload worden verwerkt door de pijpleidingen dichtbij het eind van die dag UTC (dagelijkse looppas).
  • Logs die in worden geupload de omslagen van vorige dagen (backfill) worden ontdekt en verwerkt binnen 24 uren.

Scenarios scenarios

Scenario 1: Logs in Splunk / Elasticsearch — export en upload naar S3 scenario-splunk

Doel: Haal logboeken van bestaande observatieplatforms terug en lever hen aan de S3 plaats.

  • Haal de vereiste gebieden uit Splunk/Elastic onderzoeksgebeurtenissen.
  • Transformeer elke gebeurtenis naar één JSON-object volgens het bovenstaande schema (JSON-regels).
  • Upload het resulterende dossier(s) aan de aangewezen S3 emmer en de huidige UTC dag weg: …/byocdn-other/yyyy/mm/dd/
  • De logbestanden worden automatisch verwerkt aan het einde van de UTC-dag.

Scenario 2: Lambda / Azure Function — format and upload to S3 scenario-serverless

Doel: De serverloze van het gebruik gegevens om CDN- logboeken te halen/te ontvangen, hen te normaliseren, en hen te leveren aan de S3 plaats.

  • De functie wint logboeken van de bron van de klant (logboekopslag, rij, blob opslag, enz.) terug.
  • De functie brengt gebieden in het verwachte schema in kaart en geeft lijnen JSON uit.
  • De functie uploadt uitvoer naar: …/byocdn-other/yyyy/mm/dd/
  • De logbestanden worden automatisch verwerkt aan het einde van de UTC-dag.

Snelle checklist checklist

  • Één voorwerp JSON per lijn (Lijnen JSON)
  • Exacte gebiedspelling zoals gespecificeerd
  • Gegevenstypen corrigeren
  • time_to_first_byte in milliseconden (geheel)
  • Upload aan de aangewezen omslag UTC: yyyy/mm/dd/ onder bycdn-andere
recommendation-more-help
llm-optimizer-help-main-toc