Unicodevignette|Logo Unicode.|200x200px Unicode est un standard informatique qui permet des échanges de textes dans différentes langues, à un niveau mondial. Il est développé par le Consortium Unicode, qui vise au codage de texte écrit en donnant à tout caractère de n'importe quel système d'écriture un nom et un identifiant numérique, et ce de manière unifiée, quels que soient la plateforme informatique ou le logiciel utilisé. Ce standard est lié à la norme qui décrit une table de caractères équivalente.
C (langage)C est un langage de programmation impératif, généraliste et de bas niveau. Inventé au début des années 1970 pour réécrire Unix, C est devenu un des langages les plus utilisés, encore de nos jours. De nombreux langages plus modernes comme C++, C#, Java et PHP ou JavaScript ont repris une syntaxe similaire au C et reprennent en partie sa logique. C offre au développeur une marge de contrôle importante sur la machine (notamment sur la gestion de la mémoire) et est de ce fait utilisé pour réaliser les « fondations » (compilateurs, interpréteurs.
Code BaudotLe code Baudot est dans l'histoire un des premiers codages des caractères binaires. Il est plus ancien que le code ASCII par exemple. Il est aussi appelé code télégraphique Alphabet International (AI) ou Alphabet International (AI) ou code CCITT . C'est un code binaire : chaque caractère est codé par une série de (0 ou 1), ce qui permet 2 = . Ces ne suffisent pas pour coder les lettres (26), les chiffres (10), les signes opératoires (+-/x=), la ponctuation (, ;.:!?), et les autres symboles (&, #..
UTF-8UTF-8 (abréviation de l'anglais Universal Character Set Transformation Format - ) est un codage de caractères informatiques conçu pour coder l’ensemble des caractères du « répertoire universel de caractères codés », initialement développé par l’ISO dans la norme internationale ISO/CEI 10646, aujourd’hui totalement compatible avec le standard Unicode, en restant compatible avec la norme ASCII limitée à l'anglais de base, mais très largement répandue depuis des décennies.
OrdinateurUn ordinateur est un système de traitement de l'information programmable tel que défini par Alan Turing et qui fonctionne par la lecture séquentielle d'un ensemble d'instructions, organisées en programmes, qui lui font exécuter des opérations logiques et arithmétiques. Sa structure physique actuelle fait que toutes les opérations reposent sur la logique binaire et sur des nombres formés à partir de chiffres binaires.
Alphabet cyrilliqueL’alphabet cyrillique est un alphabet permettant l'écriture de nombreuses langues d'Europe de l'Est et d'Asie centrale, principalement dans l'ex-URSS. Il est créé vers la fin du dans l'Empire bulgare, dans l'actuelle Bulgarie ou dans l'actuelle Macédoine du Nord, par des disciples du frère Cyrille ou peut-être Clément d'Ohrid (premier évêque de l'Église orthodoxe bulgare), à partir de l'alphabet grec dans sa graphie onciale et de l'alphabet glagolitique.
American Standard Code for Information InterchangeL'American Standard Code for Information Interchange (Code américain normalisé pour l'échange d'information), plus connu sous l'acronyme ASCII (, ), est une norme informatique de codage de caractères apparue dans les années 1960. C'est la norme de codage de caractères la plus influente à ce jour. ASCII définit 128 codes à 7 bits, comprenant 95 caractères imprimables : les chiffres arabes de 0 à 9, les 26 lettres de l'alphabet latin en minuscules et en capitales, des symboles mathématiques et de ponctuation.
Système hexadécimalLe système hexadécimal est un système de numération positionnel en base 16. Il utilise ainsi 16 symboles, en général les chiffres arabes pour les dix premiers chiffres et les lettres A à F pour les six suivants (en majuscule ou minuscule). Le système hexadécimal est utilisé notamment en électronique numérique et en informatique car il est particulièrement commode et permet un compromis entre le code binaire des machines et une base de numération pratique à utiliser pour les ingénieurs.
Caractère (informatique)En informatique, un caractère est . Comme en typographie, un caractère informatique peut représenter une lettre , une lettre majuscule, un chiffre, un signe de ponctuation ; mais aussi un espace, une tabulation, un retour à la ligne et quelques autres opérations spéciales (sonnerie, effacement, etc.) qui ne représentent pas des symboles (caractères de contrôle). En informatique, la notion de caractère est une notion qui dans le principe associe à un glyphe un nombre, de manière à dissocier la représentation physique du caractère de sa signification.
C++C++ est un langage de programmation compilé permettant la programmation sous de multiples paradigmes, dont la programmation procédurale, la programmation orientée objet et la programmation générique. Ses bonnes performances, et sa compatibilité avec le C en font un des langages de programmation les plus utilisés dans les applications où la performance est critique. Créé initialement par Bjarne Stroustrup dans les années 1980, le langage C++ est aujourd'hui normalisé par l'ISO.
Code Morse internationalLe code Morse international, ou l’alphabet Morse international, est un code permettant de transmettre un texte à l’aide de séries d’impulsions courtes et longues, qu’elles soient produites par des signes, une lumière, un son ou un geste. Ce code est souvent attribué à Samuel Morse, cependant plusieurs contestent cette primauté, et tendent à attribuer la paternité du langage à son assistant, Alfred Vail. Inventé en 1838 pour la télégraphie, ce codage de caractères assigne à chaque lettre, chiffre et signe de ponctuation une combinaison unique de signaux intermittents.
Système d'écriturevignette|400px|Carte légendée des systèmes d'écriture dans le monde. Un système d’écriture est un ensemble organisé et plus ou moins standardisé de signes d'écriture permettant la communication des idées. En général, il s'agit de la transcription de la parole énoncée dans une langue parlée : on parle alors de glottographie. Il existe cependant des systèmes transmettant des idées sans l'intermédiaire direct de la parole : on parle alors de sémasiographie, que tous les spécialistes ne s'accordent cependant pas à considérer comme de véritables systèmes d'écriture ; on parle donc également de pré-écriture ou de proto-écriture.
UTF-16UTF-16 est un codage des caractères définis par Unicode, où chaque caractère est codé sur une suite de un ou deux mots de 16 bits. Le codage était défini dans le rapport technique 17, annexé à la norme Unicode. Depuis, cette annexe est devenue obsolète car UTF-16 fait partie intégrante de la norme Unicode, dans son chapitre 3 Conformance, qui la définit de façon très stricte. L'UTF-16 ne doit pas être confondu avec l'UCS-2 qui est le codage, plus simple, de chaque caractère sur deux octets.
Hypertext Markup LanguageLe HyperText Markup Language, généralement abrégé HTML ou, dans sa dernière version, HTML5, est le langage de balisage conçu pour représenter les pages web. Ce langage permet d’écrire de l’hypertexte (d’où son nom), de structurer sémantiquement une page web, de mettre en forme du contenu, de créer des formulaires de saisie ou encore d’inclure des ressources multimédias dont des , des vidéos, et des programmes informatiques. L'HTML offre également la possibilité de créer des documents interopérables avec des équipements très variés et conformément aux exigences de l’accessibilité du web.
World Wide Webvignette|Logo historique du World Wide Web par Robert Cailliau. vignette|Où la toile est née, plaque commémorant la création du World Wide Web dans les locaux du CERN. Le World Wide Web ( ; littéralement la « toile (d’araignée) mondiale », abrégé www ou le Web), la toile mondiale ou la toile, est un système hypertexte public fonctionnant sur Internet. Le Web permet de consulter, avec un navigateur, des pages accessibles sur des sites. L’image de la toile d’araignée vient des hyperliens qui lient les pages web entre elles.
Extensible Markup LanguageLExtensible Markup Language, généralement appelé XML, « langage de balisage extensible » en français, est un métalangage informatique de balisage générique qui est un sous-ensemble du Standard Generalized Markup Language (SGML). Sa syntaxe est dite « extensible » car elle permet de définir différents langages avec pour chacun son vocabulaire et sa grammaire, comme XHTML, XSLT, RSS, SVG... Elle est reconnaissable par son usage des chevrons () encadrant les noms des balises.
Écriture bicaméraleUne écriture bicamérale est une écriture comprenant des lettres minuscules et des lettres capitales. Plus précisément, elle oppose deux œils de format (ou « casse ») — et parfois de tracé — différents pour chaque caractère. Par opposition, une écriture dans laquelle il n’existe pas une telle opposition est dite monocamérale ou unicamérale. On appelle les lettres des minuscules, tandis que les lettres d’un format plus grand, utilisées dans certains cas régis par la grammaire et l’orthotypographie, sont les majuscules (à ne pas confondre avec capitales).
Fin de ligneDans un fichier texte, plusieurs conventions incompatibles existent pour représenter la fin de ligne ou la fin de paragraphe. Les trois conventions principales trouvent leur origine dans des systèmes d’exploitation concurrents. Dans la convention « Unix », la fin de ligne est indiquée par le caractère saut de ligne (, code 10 de la table ASCII). C’est la convention suivie entre autres par les systèmes Multics, Unix, de type Unix (Linux, AIX, Xenix, Mac OS X), BeOS, AmigaOS, et RISC OS.
ByteLe byte (prononcé ), ou multiplet en français, est la plus petite unité « logiquement » adressable par un programme sur un ordinateur. Aujourd’hui, le besoin d'une structure commune pour le partage des données a fait que le byte de , appelé octet, s'est généralisé en informatique. Cependant, jusque dans les années 1970, il existait des processeurs avec des bytes de tailles très variables ; il existe, pour la programmation des automates et autres équipements industriels simples, des processeurs utilisant des mémoires adressables par quantité de , voire moins ; beaucoup de microprocesseurs adressent physiquement la mémoire par mot de plusieurs bytes afin d'augmenter les performances.
PonctuationLa ponctuation a pour but l’organisation de l’écrit grâce à un ensemble de signes graphiques. Elle a trois fonctions principales. Elle anime le texte en indiquant des faits de la langue orale, comme l’intonation ou les pauses de diverses longueurs (indications prosodiques). Elle marque les degrés de subordination entre les différents éléments du discours (rapports syntaxiques). Enfin elle précise le sens et définit les liens logiques entre ces éléments (informations sémantiques).