Ogólne#

Łańcuchy znaków#

Łańcuch znaków (string) to ogólny termin określający dowolne dane tekstowe. Można używać zamiennych zwrotów, takich jak "ciąg znaków", "łańcuch znaków", "łańcuch znakowy" lub krótko "łańcuch". W kursie będę posługiwał się różnymi polskimi odpowiednikami dla anglojęzycznej formy "string".

Ciąg znaków może także nawiązywać do konkretnego typu, który będzie zawężać liczbę dostępnych kombinacji, np. tylko wielkie litery ASCII, typ DOMString itd.

DOM4 wprowadza kilka pojęć i algorytmów dla łańcuchów znaków (strings). W tym miejscu scharakteryzuję krótko poszczególne zagadnienia, gdyż będą miały zastosowanie przy opisach konkretnych poleceń w dalszej części kursu.

Pojęcia#

case-sensitive

Porównanie dwóch łańcuchów znaków z uwzględnieniem czułości na wielkość znaków # (case-sensitive) oznacza ich dokładne porównanie, kod znaku dla kodu znakowego.

ASCII case-insensitive

Porównanie dwóch łańcuchów znaków pod względem nieczułości na wielkości znaków ASCII # (ASCII case-insensitive) oznacza ich dokładne porównanie, kod znaku dla kodu znakowego, z wyjątkiem znaków z zakresu U+0041...U+005A (tj. od LATIN CAPITAL LETTER A do LATIN CAPITAL LETTER Z) i odpowiadających im znaków z zakresu U+0061...U+007A (tj. od LATIN SMALL LETTER A do LATIN SMALL LETTER Z), które uważa się za zgodne. W uproszczeniu, wielkość liter przy porównaniu nie ma znaczenia.

converting a string to ASCII uppercase

Konwersja łańcucha znaków na duże litery ASCII # (converting a string to ASCII uppercase) oznacza zamianę wszystkich znaków z zakresu U+0061...U+007A (tj. od LATIN SMALL LETTER A do LATIN SMALL LETTER Z) na odpowiadające im znaki z zakresu U+0041...U+005A (tj. od LATIN CAPITAL LETTER A do LATIN CAPITAL LETTER Z). W uproszczeniu, małe litery zamieniane są na duże litery.

converting a string to ASCII lowercase

Konwersja łańcucha znaków na małe litery ASCII # (converting a string to ASCII lowercase) oznacza zamianę wszystkich znaków z zakresu U+0041...U+005A (tj. od LATIN CAPITAL LETTER A do LATIN CAPITAL LETTER Z) na odpowiadające im znaki z zakresu U+0061...U+007A (tj. od LATIN SMALL LETTER A do LATIN SMALL LETTER Z). W uproszczeniu, duże litery zamieniane są na małe litery.

prefix match

Łańcuch znakowy pattern jest pasującym prefiksem (prefix match) dla łańcucha znaków s, kiedy pattern nie jest dłuższy od s oraz obcinanie s względem długości pattern pozostawi dwa pasujące do siebie łańcuchy znaków.

ASCII whitespace

Białe znaki ASCII # (ASCII whitespace), stosowane w specyfikacji DOM4, to znaki U+0020 SPACE, U+0009 CHARACTER TABULATION (tab), U+000A LINE FEED (LF), U+000C FORM FEED (FF) i U+000D CARRIAGE RETURN (CR).

Pasek społecznościowy

SPIS TREŚCI AKTUALNEJ STRONY

Ogólne (H1) Łańcuchy znaków (H2) Pojęcia (H3) case-sensitive (H4) ASCII case-insensitive (H4) converting a string to ASCII uppercase (H4) converting a string to ASCII lowercase (H4) prefix match (H4) ASCII whitespace (H4) Algorytmy (H3) collect a code point sequence (H4) skip ASCII whitespace (H4) ordered set serializer (H4) ordered set parser (H4)