Welke bestandstypen worden ondersteund?
Momenteel zijn de ondersteunde bestandstypen gescheiden bestanden, JSON en Parquet.
Wat zijn de beperkingen op bestandsnamen en -grootten?
Hieronder volgt een lijst met beperkingen die u voor bestanden in bronnen moet opgeven.
- Namen van mappen en bestandscomponenten mogen niet langer zijn dan 255 tekens.
- De folder en de dossiernamen kunnen niet met een voorwaartse schuine streep (
/
) beëindigen. Indien beschikbaar wordt deze automatisch verwijderd. - De volgende gereserveerde URL-tekens moeten correct worden beschermd:
! ' ( ) ; @ & = + $ , % # [ ]
- De volgende tekens zijn niet toegestaan:
" \ / : | < > * ?
. - Ongeldige URL-padtekens niet toegestaan. Codepunten zoals
\uE000
zijn weliswaar geldig in NTFS-bestandsnamen, maar zijn geen geldige Unicode-tekens. Bovendien zijn sommige ASCII- of Unicode-tekens, zoals besturingstekens (0x00 tot 0x1F, \u0081, enz.), niet toegestaan. Voor regels die de koorden van Unicode in HTTP/1.1 bepalen zie RFC 2616, Sectie 2.2: BasisRegelsen RFC 3987. - De volgende bestandsnamen zijn niet toegestaan: LPT1, LPT2, LPT3, LPT4, LPT5, LPT6, LPT7, LPT8, LPT9, COM1, COM2, COM3, COM4, COM5, COM6, COM7, COM8, COM9, PRN, AUX, NUL, CON, CLOCK$, puntteken (.) en twee stippen ( …).
- Het maximumaantal bestanden per batch is 1500, met een maximale batch-grootte van 100 GB.
- Het maximumaantal eigenschappen of velden per rij is 10.000.
- Het maximumaantal batches dat per gebruiker kan worden verzonden, per minuut is 2000.
Welke gegevenstypen worden ondersteund?
Tot de ondersteunde gegevenstypen behoren gehele getallen, tekenreeksen, booleans, datetime-objecten, arrays en objecten.
Welke datum- en tijdnotaties worden ondersteund?
De bronnen steunen een grote verscheidenheid van datetime formaten terwijl het opnemen van gegevens. Meer informatie over gesteunde datetime formaten kan in de datumsectie van de gegevens worden gevonden die gidsverwerken in de Prep documentatie van Gegevens.
Hoe kan ik arrays opmaken in CSV-, JSON- en Parquet-bestanden?
JSON- en Parquet-bestanden bieden native ondersteuning voor arrays. Voor vlakke structuren, zoals CSV's, worden arrays niet ondersteund. Tekenreeksen met meerdere waarden kunnen echter worden opgedeeld in een array, waarbij gebruik wordt gemaakt van prep-functies, zoals exploderen en samenvoegen. Meer informatie over deze gegevens prep functies kan in de gegevens worden gevonden prep functies gids
Welke bronnen ondersteunen gedeeltelijke inname?
Alle bronnen van inname in de batch ondersteunen gedeeltelijke inname. Bij streamingbronnen wordt gedeeltelijke inname echter niet ondersteund.
Wanneer moet ik gedeeltelijke inname gebruiken?
Gedeeltelijke opname zou moeten worden gebruikt als u niet beperkingen hebt, zoals het hebben van het volledige dossier dat in Platform wordt opgenomen. U kunt ook gedeeltelijke inname gebruiken als u er geen moeite mee hebt gegevens in te voeren die fouten erin kunnen bevatten.
Wat is de typische drempel voor gedeeltelijke inname?
Er is geen "typische foutendrempel"voor gedeeltelijke inname. In plaats daarvan kan deze waarde variëren van het gebruik van hoofdletters en kleine letters. Standaard is de foutdrempel ingesteld op 5%.
Hoe lang duurt het voordat een status van een flowuitvoering wordt bijgewerkt nadat een nieuwe gegevensstroom is gemaakt?
Er worden geen stroomuitvoeringen onmiddellijk gegenereerd en het kan ongeveer twee tot drie minuten duren voordat de gegevens zijn bijgewerkt nadat de waarde is toegewezen startTime
. Als u de status van een flow-run controleert, wordt direct na het maken van een nieuwe dataflow geen informatie over de flow-run lastRunDetails
geretourneerd, omdat dit nog niet is gebeurd. Het wordt aanbevolen de gegevensstroom een paar minuten te laten genereren voordat de status van de flow wordt gecontroleerd.