Système hexadécimalLe système hexadécimal est un système de numération positionnel en base 16. Il utilise ainsi 16 symboles, en général les chiffres arabes pour les dix premiers chiffres et les lettres A à F pour les six suivants (en majuscule ou minuscule). Le système hexadécimal est utilisé notamment en électronique numérique et en informatique car il est particulièrement commode et permet un compromis entre le code binaire des machines et une base de numération pratique à utiliser pour les ingénieurs.
UTF-8UTF-8 (abréviation de l'anglais Universal Character Set Transformation Format - ) est un codage de caractères informatiques conçu pour coder l’ensemble des caractères du « répertoire universel de caractères codés », initialement développé par l’ISO dans la norme internationale ISO/CEI 10646, aujourd’hui totalement compatible avec le standard Unicode, en restant compatible avec la norme ASCII limitée à l'anglais de base, mais très largement répandue depuis des décennies.
Codage des caractèresvignette|alt=Carte rectangulaire beige clair avec dans le sens de la longueur 10 lignes constituées chacune d'une suite de chiffre identique, de 1 à 10. Des perforations verticales font disparaître certains de ces chiffres|Carte perforée à 80 colonnes, sur laquelle est codé le texte de programmation « CALL RCLASS (AAA, 21, NNC, PX3, PX4) ».
CollationCollation is the assembly of written information into a standard order. Many systems of collation are based on numerical order or alphabetical order, or extensions and combinations thereof. Collation is a fundamental element of most office filing systems, library catalogs, and reference books. Collation differs from classification in that the classes themselves are not necessarily ordered. However, even if the order of the classes is irrelevant, the identifiers of the classes may be members of an ordered set, allowing a sorting algorithm to arrange the items by class.
Système d'écriturevignette|400px|Carte légendée des systèmes d'écriture dans le monde. Un système d’écriture est un ensemble organisé et plus ou moins standardisé de signes d'écriture permettant la communication des idées. En général, il s'agit de la transcription de la parole énoncée dans une langue parlée : on parle alors de glottographie. Il existe cependant des systèmes transmettant des idées sans l'intermédiaire direct de la parole : on parle alors de sémasiographie, que tous les spécialistes ne s'accordent cependant pas à considérer comme de véritables systèmes d'écriture ; on parle donc également de pré-écriture ou de proto-écriture.
ISO/CEI 8859-1La norme ISO 8859-1, dont le nom complet est ISO/CEI 8859-1, et qui est souvent appelée Latin-1 ou Europe occidentale, forme la première partie de la norme internationale ISO/CEI 8859, qui est une norme de l’Organisation internationale de normalisation pour le codage des caractères en informatique. Elle définit ce qu’elle appelle l’alphabet latin numéro 1, qui consiste en 191 caractères de l’alphabet latin, chacun d’entre eux étant codé sur un octet (soit 8 bits). ISO 8859-1 reprend le codage des caractères imprimables d’US-ASCII.
Extensible Markup LanguageLExtensible Markup Language, généralement appelé XML, « langage de balisage extensible » en français, est un métalangage informatique de balisage générique qui est un sous-ensemble du Standard Generalized Markup Language (SGML). Sa syntaxe est dite « extensible » car elle permet de définir différents langages avec pour chacun son vocabulaire et sa grammaire, comme XHTML, XSLT, RSS, SVG... Elle est reconnaissable par son usage des chevrons () encadrant les noms des balises.
Ligature (écriture)thumb|right|Exemples de ligatures vignette|droite|Caractères mobiles en bois avec ligatures (de gauche à droite) fl, ft, ff, fi en 20 cicéros = 240 points = 90,24 mm En typographie, une ligature est la fusion de deux ou trois graphèmes d’une écriture pour en former un nouveau, considéré ou non comme un caractère à part entière. C'est un des procédés possibles d’enrichissement du stock de graphèmes d’une langue. La ligature peut donner naissance à un digramme.
PonctuationLa ponctuation a pour but l’organisation de l’écrit grâce à un ensemble de signes graphiques. Elle a trois fonctions principales. Elle anime le texte en indiquant des faits de la langue orale, comme l’intonation ou les pauses de diverses longueurs (indications prosodiques). Elle marque les degrés de subordination entre les différents éléments du discours (rapports syntaxiques). Enfin elle précise le sens et définit les liens logiques entre ces éléments (informations sémantiques).
Alphabet latinalt=|vignette|350x350px|Distribution de l'alphabet latin. L'alphabet latin' est un alphabet bicaméral comportant vingt-six lettres de base, principalement utilisé pour écrire les langues d’Europe de l'Ouest, d'Europe du Nord et d'Europe centrale, ainsi que les langues de nombreux pays qui ont été exposés à une forte influence européenne, notamment à travers la colonisation européenne des Amériques, de l'Afrique et de l'Océanie.
Caractères chinoisLes caractères chinois, ou sinogrammes, sont les unités logographiques qui composent l'écriture des langues chinoises. Ils sont appelés en chinois hànzì (« caractères han »), s'écrivant, en , et depuis le en République populaire de Chine, en Malaisie et à Singapour, en . Ils ont été dans le passé ou sont également de nos jours utilisés pour écrire d'autres langues, à titre principal ou complémentaire, notamment le coréen (hanja), le japonais (kanji) ou le vietnamien (chữ nho).
GraphèmeEn linguistique, un graphème est la plus petite entité d'un système d'écriture. C'est l’unité graphique correspondant en général à l'unité orale qu'est le phonème (contre-exemple en français le graphème complexe qui renvoie à deux phonèmes). Contrairement à l'unité « lettre », le graphème correspond ainsi mieux à la phonologie d'une langue. Cela est particulièrement visible dans le cas des graphèmes dits « complexes ». Les graphèmes peuvent se distinguer en deux sous-types : graphème simple : graphème composé d'une lettre ; graphème complexe : graphème composé de deux ou trois lettres.
SyllabaireUn syllabaire est un ensemble de symboles utilisés par une écriture syllabique pour représenter les sons vocalisés ou groupés d'une langue. Les symboles représentent des syllabes, à la différence des écritures alphabétiques où les symboles représentent des sons ou des phonèmes unitairement. La philologue Silvia Ferrara note que dans le langage, le son est émis naturellement sous forme de syllabes, si bien que les premières écritures s'organisent autour de la structure syllabique.
American Standard Code for Information InterchangeL'American Standard Code for Information Interchange (Code américain normalisé pour l'échange d'information), plus connu sous l'acronyme ASCII (, ), est une norme informatique de codage de caractères apparue dans les années 1960. C'est la norme de codage de caractères la plus influente à ce jour. ASCII définit 128 codes à 7 bits, comprenant 95 caractères imprimables : les chiffres arabes de 0 à 9, les 26 lettres de l'alphabet latin en minuscules et en capitales, des symboles mathématiques et de ponctuation.
World Wide Webvignette|Logo historique du World Wide Web par Robert Cailliau. vignette|Où la toile est née, plaque commémorant la création du World Wide Web dans les locaux du CERN. Le World Wide Web ( ; littéralement la « toile (d’araignée) mondiale », abrégé www ou le Web), la toile mondiale ou la toile, est un système hypertexte public fonctionnant sur Internet. Le Web permet de consulter, avec un navigateur, des pages accessibles sur des sites. L’image de la toile d’araignée vient des hyperliens qui lient les pages web entre elles.
Hypertext Markup LanguageLe HyperText Markup Language, généralement abrégé HTML ou, dans sa dernière version, HTML5, est le langage de balisage conçu pour représenter les pages web. Ce langage permet d’écrire de l’hypertexte (d’où son nom), de structurer sémantiquement une page web, de mettre en forme du contenu, de créer des formulaires de saisie ou encore d’inclure des ressources multimédias dont des , des vidéos, et des programmes informatiques. L'HTML offre également la possibilité de créer des documents interopérables avec des équipements très variés et conformément aux exigences de l’accessibilité du web.
Écritures brahmiquesThe Brahmic scripts, also known as Indic scripts, are a family of abugida writing systems. They are used throughout the Indian subcontinent, Southeast Asia and parts of East Asia. They are descended from the Brahmi script of ancient India and are used by various languages in several language families in South, East and Southeast Asia: Indo-Aryan, Dravidian, Tibeto-Burman, Mongolic, Austroasiatic, Austronesian, and Tai. They were also the source of the dictionary order (gojūon) of Japanese kana.
LogogrammeUn logogramme (du grec ancien : , « parole », ici « mot », et , « caractère, lettre ») est un unique graphème notant un lemme (mot) entier et pas seulement une partie de ses phonèmes. Dans la majorité des cas, rien n'indique, dans un logogramme, comment il doit être prononcé (le signifiant en linguistique). En d'autres termes, c'est la plus petite unité significative du langage comme signe unique écrit qui représente un mot complet, indépendamment de la langue.
UTF-16UTF-16 est un codage des caractères définis par Unicode, où chaque caractère est codé sur une suite de un ou deux mots de 16 bits. Le codage était défini dans le rapport technique 17, annexé à la norme Unicode. Depuis, cette annexe est devenue obsolète car UTF-16 fait partie intégrante de la norme Unicode, dans son chapitre 3 Conformance, qui la définit de façon très stricte. L'UTF-16 ne doit pas être confondu avec l'UCS-2 qui est le codage, plus simple, de chaque caractère sur deux octets.
Écriture hiéroglyphique égyptienneL’écriture hiéroglyphique égyptienne est un système d'écriture figurative : les caractères qui la composent représentent en effet des objets divers tels que des plantes, des figures de dieux, d'humains et d'animaux ( classification des hiéroglyphes). Les égyptologues y distinguent traditionnellement trois catégories de signes : les signes-mots (ou idéogrammes), qui représentent un objet ou, par métonymie, une action ; les signes phonétiques (ou phonogrammes), qui notent un son (consonne, suite de consonnes ou voyelle) ; les déterminatifs, signes « muets » qui indiquent le champ lexical auquel appartient le mot.