CSV Filter Options

Filtr CSV akceptuje ciąg opcji zawierający od pięciu do trzynastu tokenów oddzielonych przecinkami. Tokeny od 6 do 13 są opcjonalne.

Przykład:

Import z UTF-8, język niemiecki, oddzielone przecinkami, ogranicznik tekstu ", pole w cudzysłowie jako tekst. Plik CSV zawiera kolumny sformatowane jako data, liczba, liczba i liczba:

soffice --infilter="Text - txt - csv (StarCalc):44,34,76,1,1/5/2/1/3/1/4/1,1031,true,true" test.csv

Eksportuj do Windows-1252, ogranicznik pola: przecinek, ogranicznik tekstu: cytat, zapisz zawartość komórki jak przedstawiono:

soffice --convert-to "Text - txt - csv (StarCalc):44,34,ANSI,1,,0,false,true,true" --outdir=/home/user test.ods

Pozycja tokena

Definicja

Znaczenie i przykład tokena

1

Separator pól

Separatory pól jako wartości ASCII. Wiele wartości jest oddzielonych znakiem ukośnika ("/"), co oznacza, że jeśli wartości są oddzielone średnikami i tabulatorami poziomymi, tokenem będzie 59/9. Aby traktować kilka kolejnych separatorów jako jeden, należy dołączyć "/MRG" do tokena. Jeśli plik zawiera pola o stałej szerokości, użyj opcji "FIX". Przykład: 44 (,)

2

Ogranicznik tekstu

Ogranicznik tekstu jako wartość ASCII, np. 34 w cudzysłowach podwójnych i 39 w cudzysłowach pojedynczych. Przykład: 34 (").

3

Zestaw znaków

Kod zestawu znaków używany w pliku zgodnie z opisem w poniższej tabeli. Przykład: 0 (system).

4

Import CSV

  • N Line number to start reading. Example: 3 (start from third line).

5

Kod formatowania komórek dla każdej kolumny

Sekwencja kodu kolumny/formatowania, gdzie kod formatowania jest podany w poniższej tabeli. Przykład: "1/5/2/1/3/1/4/1".

Jeśli używane są separatory wartości, postać tego tokena to kolumna/format[/kolumna/format/…], gdzie kolumna to numer kolumny, gdzie 1 to kolumna znajdująca się najbardziej po lewej stronie. Kod formatu jest szczegółowo opisany poniżej.

Jeśli pierwszym tokenem jest FIX, ma on postać start/format[/start/format/…], gdzie start to numer pierwszego znaku dla tego pola, gdzie 0 to znak znajdujący się najbardziej na lewo w wierszu. Format wyjaśniono poniżej.

6

Identyfikator języka

Ciąg wyrażony w notacji dziesiętnej. Ten token jest odpowiednikiem pola listy "Język" w interfejsie użytkownika do importu pliku CSV. Jeśli wartość wynosi 0 lub jest pominięta, używany jest identyfikator języka interfejsu użytkownika. Identyfikator języka jest oparty na identyfikatorach języka firmy Microsoft.

7

CSV Import, CSV Export

Ciąg, false albo true. Wartość domyślna: false. Token ten jest odpowiednikiem pola wyboru "Cytowane pole jako tekst".

8

CSV Import, CSV Export

Importuj: ciąg znaków, false albo true. Wartość domyślna: false. Token ten jest odpowiednikiem pola wyboru "Wykryj numery specjalne".

Eksportuj: ciąg, "false" lub "true". Wartość domyślna: true. Ten token nie ma odpowiednika w interfejsie użytkownika. Jeśli true, komórki liczbowe są przechowywane jako liczby. Jeśli false, liczby są przechowywane jako tekst z ogranicznikami tekstu.

9

Eksport CSV

Ciąg, false albo true. Wartość domyślna:true. Token ten jest odpowiednikiem pola wyboru "Zapisz zawartość komórki jak przedstawiono".

10

Eksport CSV

Ciąg, false albo true. Wartość domyślna: false. Eksportuj formuły komórek.

11

Import CSV

Ciąg, false albo true. Wartość domyślna: false. Usuń odstępy. Przycinaj początkowe i końcowe odstępy podczas odczytu pliku.

12

Eksport CSV

Eksportuj cały dokument do pojedynczych arkuszy plików .csv lub określonego arkusza.

  • 0 or absent means the default behaviour, first sheet from command line, or current sheet in macro filter options, exported to sample.csv

  • -1 for all sheets, each sheet is exported to an individual file of the base file name concatenated with the sheet name, for example sample-Sheet1.csv, sample-Sheet2.csv and sample-Sheet3.csv

  • N export the N-th sheet within the range of number of sheets. Example: to export the second sheet, set 2 here to get sample-Sheet2.csv

13

Import CSV

Ciąg, false albo true. Wartość domyślna: false. Określa, czy wyrażenia formuł zaczynające się od znaku równości = mają być oceniane jako formuły, czy importowane jako dane tekstowe. Jeśli true ocenia formuły na wejściu. Jeśli false formuły są wprowadzane jako tekst. Jeśli zostanie pominięty (w ogóle nie występuje), domyślną wartością jest true, aby zachować zachowanie ciągu opcji ze starych wersji, które w ogóle nie miały tego tokena. Jeśli obecny i pusty (lub dowolna inna wartość niż true), domyślną wartością jest false.


Specjalny przypadek plików CSV z separatorem zdefiniowanym w pierwszym wierszu

Import i eksport CSV obsługują ustawienie separatora pól sep= i "sep=". Podczas odczytu dokumentu CSV separator jest pobierany z początkowego pojedynczego pola sep= lub "sep=", jeśli jest to jedyna treść wiersza.

Podczas odczytywania pliku CSV cytowana forma jest zachowywana jako (niecytowana) zawartość komórki. Widzisz sep=|, gdy | jest separatorem w pierwszym wierszu. W formie bez cudzysłowów separator jest odrzucany, ponieważ jest to rzeczywisty separator pól w kontekście. Widzisz sep= w pierwszym wierszu.

Podczas zapisywania pliku CSV, istniejąca zawartość pojedynczej komórki w lewym górnym rogu, taka jak sep=| jest dopasowywana do bieżącego separatora za pomocą cytowanej formy "sep=|" (jeśli cudzysłowy/ograniczniki tekstu nie są puste, a | jest separatorem) i zawsze używa znaku podwójnego cudzysłowu ASCII ".

Jeśli wiersz zawierający sep=| nie ma być importowany jako dane, pamiętaj o ustawieniu numeru Od wiersza w oknie dialogowym na 2. Zauważ, że ten wiersz nie będzie zachowane podczas ponownego zapisywania.

Przykład:


        sep=|
        "LITERA"|"ZWIERZĘ"
        "a"|"antylopa"
        "b"|"bocian"
        "c"|"chomik"
    

Kody formatowania dla tokena 5

Znaczenie

Kod

Standardowy

1

Теkst

2

MM/DD/RR

3

DD/MM/RR

4

RR/MM/DD

5

-

6

-

7

-

8

Ignoruj pole (nie importuj)

9

Angielski (USA)

10


Kody zestawów znaków dla tokena 3

Zestaw znaków

Indeks

Nieznany

0

Windows-1252/WinLatin 1 (zachodni)

1

Apple Macintosh (zachodni)

2

DOS/OS2-437/US (zachodni)

3

DOS/OS2-850/Międzynarodowy (zachodni)

4

DOS/OS2-860/Portugalski (zachodni)

5

DOS/OS2-861/Islandzki (zachodni)

6

DOS/OS2-863/Kanadyjsko-francuski (zachodni)

7

DOS/OS2-865/Nordycki (zachodni)

8

Domyślny systemu

9

Symbol

10

ASCII/US (zachodni)

11

ISO-8859-1 (zachodni)

12

ISO-8859-2 (środkowoeuropejski)

13

ISO-8859-3 (łaciński 3)

14

ISO-8859-4 (bałtycki)

15

ISO-8859-5 (cyrylica)

16

ISO-8859-6 (arabski)

17

ISO-8859-7 (grecki)

18

ISO-8859-8 (hebrajski)

19

ISO-8859-9 (turecki)

20

ISO-8859-14 (zachodni)

21

ISO-8859-15/EURO (zachodni)

22

DOS/OS2-737 (grecki)

23

DOS/OS2-775 (bałtycki)

24

DOS/OS2-852 (środkowoeuropejski)

25

DOS/OS2-855 (cyrylica)

26

DOS/OS2-857 (turecki)

27

DOS/OS2-862 (hebrajski)

28

DOS/OS2-864 (arabski)

29

DOS/OS2-866/Rosyjski (cyrylica)

30

DOS/OS2-869/Współczesny (grecki)

31

DOS/Windows-874 (tajski)

32

Windows-1250/WinLatin 2 (środkowoeuropejski)

33

Windows-1251 (cyrylica)

34

Windows-1253 (grecki)

35

Windows-1254 (turecki)

36

Windows-1255 (hebrajski)

37

Windows-1256 (arabski)

38

Windows-1257 (bałtycki)

39

Windows-1258 (wietnamski)

40

Apple Macintosh (arabski)

41

Apple Macintosh (środkowoeuropejski)

42

Apple Macintosh/Chorwacki (środkowoeuropejski)

43

Apple Macintosh (cyrylica)

44

Nieobsługiwany: Apple Macintosh (dewanagari)

45

Nieobsługiwany: Apple Macintosh (perski)

46

Apple Macintosh (grecki)

47

Nieobsługiwany: Apple Macintosh (gudżarati)

48

Nieobsługiwany: Apple Macintosh (gurmukhi)

49

Apple Macintosh (hebrajski)

50

Apple Macintosh/Islandzki (zachodni)

51

Apple Macintosh/Rumuński (środkowoeuropejski)

52

Apple Macintosh (tajski)

53

Apple Macintosh (turecki)

54

Apple Macintosh/Ukraiński (cyrylica)

55

Apple Macintosh (chiński uproszczony)

56

Apple Macintosh (chiński tradycyjny)

57

Apple Macintosh (japoński)

58

Apple Macintosh (koreański)

59

Windows-932 (japoński)

60

Windows-936 (chiński uproszczony)

61

Windows-Wansung-949 (koreański)

62

Windows-950 (chiński tradycyjny)

63

Shift-JIS (japoński)

64

GB-2312 (chiński uproszczony)

65

GBT-12345 (chiński tradycyjny)

66

GBK/GB-2312-80 (chiński uproszczony)

67

BIG5 (chiński tradycyjny)

68

EUC-JP (japoński)

69

EUC-CN (chiński uproszczony)

70

EUC-TW (chiński tradycyjny)

71

ISO-2022-JP (japoński)

72

ISO-2022-CN (chiński uproszczony)

73

KOI8-R (cyrylica)

74

Unicode (UTF-7)

75

Unicode (UTF-8)

76

ISO-8859-10 (środkowoeuropejski)

77

ISO-8859-13 (środkowoeuropejski)

78

EUC-KR (koreański)

79

ISO-2022-KR (koreański)

80

JIS 0201 (japoński)

81

JIS 0208 (japoński)

82

JIS 0212 (japoński)

83

Windows-Johab-1361 (koreański)

84

GB-18030 (chiński uproszczony)

85

BIG5-HKSCS (chiński tradycyjny)

86

TIS 620 (tajski)

87

KOI8-U (cyrylica)

88

ISCII dewanagari (indyjski)

89

Unicode (zmodyfikowany UTF-8 Javy)

90

Adobe Standard

91

Adobe Symbol

92

PT 154 (Azjatycka strona kodowa cyrylicy systemu Windows opracowana w ParaType)

93

Unicode UCS4

65534

Unicode UCS2

65535