Publication

On Learning Grapheme-to-Phoneme Relationships through the Acoustic Speech Signal

Concepts associés (29)

En phonologie, domaine de la linguistique, un phonème est la plus petite unité discrète (ou distinctive, c'est-à-dire permettant de distinguer des mots les uns des autres) que l'on puisse isoler par segmentation dans la chaîne parlée. Un phonème est en réalité une entité abstraite, qui peut correspondre à plusieurs sons. Il est en effet susceptible d'être prononcé de façon différente selon les locuteurs ou selon sa position et son environnement au sein du mot (voir allophone) : les phones sont les différentes réalisations d'un phonème.

Graphème

En linguistique, un graphème est la plus petite entité d'un système d'écriture. C'est l’unité graphique correspondant en général à l'unité orale qu'est le phonème (contre-exemple en français le graphème complexe qui renvoie à deux phonèmes). Contrairement à l'unité « lettre », le graphème correspond ainsi mieux à la phonologie d'une langue. Cela est particulièrement visible dans le cas des graphèmes dits « complexes ». Les graphèmes peuvent se distinguer en deux sous-types : graphème simple : graphème composé d'une lettre ; graphème complexe : graphème composé de deux ou trois lettres.

Phonemic orthography

A phonemic orthography is an orthography (system for writing a language) in which the graphemes (written symbols) correspond to the phonemes (significant spoken sounds) of the language. Natural languages rarely have perfectly phonemic orthographies; a high degree of grapheme–phoneme correspondence can be expected in orthographies based on alphabetic writing systems, but they differ in how complete this correspondence is.

Transparence orthographique

La transparence orthographique désigne, pour une langue donnée, le degré de correspondance entre l'orthographe et la phonologie de la langue, c'est-à-dire la correspondance entre la façon dont on écrit la langue et dont on la prononce. Une langue parfaitement transparente est une langue dans laquelle la correspondance entre graphèmes et phonèmes est consistante : à un phonème (plus petite unité prononçable d'un mot) correspond un et un seul graphème (lettre ou ensemble de lettres associés à un son de la langue, comme « a » ou « ch ») et réciproquement.

Reconnaissance automatique de la parole

vignette|droite|upright=1.4|La reconnaissance vocale est habituellement traitée dans le middleware ; les résultats sont transmis aux applications utilisatrices. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine.

Lexical Markup Framework

Lexical Markup Framework (LMF ou cadre de balisage lexical, en français) est le standard de l'Organisation internationale de normalisation (plus spécifiquement au sein de l'ISO/TC37) pour les lexiques du traitement automatique des langues (TAL). L'objectif est la normalisation des principes et méthodes relatifs aux ressources langagières dans le contexte de la communication multilingue et de la diversité culturelle.

Système d'écriture

vignette|400px|Carte légendée des systèmes d'écriture dans le monde. Un système d’écriture est un ensemble organisé et plus ou moins standardisé de signes d'écriture permettant la communication des idées. En général, il s'agit de la transcription de la parole énoncée dans une langue parlée : on parle alors de glottographie. Il existe cependant des systèmes transmettant des idées sans l'intermédiaire direct de la parole : on parle alors de sémasiographie, que tous les spécialistes ne s'accordent cependant pas à considérer comme de véritables systèmes d'écriture ; on parle donc également de pré-écriture ou de proto-écriture.

Lexical resource

In digital lexicography, natural language processing, and digital humanities, a lexical resource is a language resource consisting of data regarding the lexemes of the lexicon of one or more languages e.g., in the form of a database. Different standards for the machine-readable edition of lexical resources exist, e.g., Lexical Markup Framework (LMF) an ISO standard for encoding lexical resources, comprising an abstract data model and an XML serialization, and OntoLex-Lemon, an RDF vocabulary for publishing lexical resources as knowledge graphs on the web, e.

Orthographe

En linguistique, le terme orthographe (du latin orthographia, lui-même issu du grec , composé de , « droit, correct », et de , « écrire ») dénomme un système de règles concernant l'écriture d'une langue, faisant partie de son standard, en comparaison duquel on juge comme correctes ou incorrectes les formes que les utilisateurs réalisent en écrivant cette langue.

Allophone (phonologie)

En linguistique, un allophone est l'une des réalisations sonores possibles d'un phonème. Contrairement à deux phonèmes entre eux, deux allophones d'un même phonème ne peuvent s'opposer en distinguant des unités de sens distincts dans une langue : les locuteurs leur attribuent le même rôle fonctionnel en phonologie, même quand ils perçoivent la différence phonétique entre les deux. Dans le texte qui suit, une forme entre crochets indique une transcription phonétique, tandis qu'une entre barres obliques indique une transcription phonologique.

Langue écrite

thumb|right|Exemples de fontes de caractères employées pour noter différentes langues, par William Caslon, fondeur-typographe, dans la Cyclopaedia (1728). Une langue écrite est une langue dotée d'une représentation au moyen d’un système d’écriture. La langue écrite est une invention (technique) dans la mesure où elle doit être enseignée aux enfants ; les enfants apprendront la langue parlée (langue orale ou langue des signes) en y étant exposés et sans vraiment qu’on la leur ait apprise.

Désambiguïsation lexicale

La désambiguïsation lexicale ou désambigüisation lexicale est la détermination du sens d'un mot dans une phrase lorsque ce mot peut avoir plusieurs sens possibles. Dans la linguistique informatique, la désambiguïsation lexicale est un problème non résolu dans le traitement des langues naturelles et de l'ontologie informatique. La résolution de ce problème permettrait des avancées importantes dans d'autres champs de la linguistique informatique comme l'analyse du discours, l'amélioration de la pertinence des résultats des moteurs de recherche, la résolution des anaphores, la cohérence, l'inférence, etc.

Dictionnaire

thumb|upright=1.2|Dictionnaire en latin constitué de plusieurs volumes, œuvre d'Egidio Forcellini (1771). Un dictionnaire est un ouvrage de référence contenant un ensemble de mots d’une langue ou d’un domaine d’activité généralement présentés par ordre alphabétique et fournissant pour chacun une définition, une explication ou une correspondance (synonyme, antonyme, cooccurrence, traduction, étymologie). Le présent article concerne les dictionnaires unilingues qui décrivent ou normalisent une langue.

Voisement

Le voisement est une qualité (ou propriété) de certains sons de la parole. Un son est voisé si sa production s’accompagne d'une vibration des cordes vocales et sinon, il est non voisé. Tout locuteur peut facilement faire l’expérience de ce phénomène en plaçant sa main sur sa gorge (au niveau de la pomme d'Adam) puis en prononçant successivement « ssssss » (non voisé) et « zzzzzz » (voisé). Dans la tradition francophone, on utilise le terme sonorisation (opposition sourd / sonore), voisement étant un anglicisme.

Prononciation de l'anglais

La prononciation de l'anglais varie considérablement dans sa phonologie, principalement en raison de son histoire, à travers différentes périodes historiques distinctes, et de son expansion géographique.

Acoustique industrielle

L'acoustique industrielle est le domaine technologique de l'application de vibrations pour transformer des matériaux. Les fréquences de ces vibrations, de forte puissance, sont fréquemment au-delà du domaine audible. Les procédés les plus courants sont le décapage, la découpe et le soudage par ultrasons. Selon une autre définition, l'acoustique industrielle est l'ensemble des techniques servant à modifier la production et la transmission des sons et des bruits propres à l'industrie.

WordNet

WordNet est une base de données lexicale développée par des linguistes du laboratoire des sciences cognitives de l'université de Princeton depuis une vingtaine d'années. Son but est de répertorier, classifier et mettre en relation de diverses manières le contenu sémantique et lexical de la langue anglaise. Des versions de WordNet pour d'autres langues existent, mais la version anglaise est cependant la plus complète à ce jour. La base de données ainsi que des outils sont disponibles gratuitement.

Prononciation

En phonétique, le terme prononciation a deux sens principaux. L’un se rapporte à l’action de produire, d’émettre des phones (sons) articulés à l’aide des organes de la parole. L’autre se réfère à la manière d’effectuer cette action dans le cas des sons et groupes de sons concrets, ainsi que des mots et des groupes de mots. On parle aussi de la prononciation d’une langue ou d’une variété de langue (dialecte, sociolecte) en se référant aux sons qu’elle possède, ainsi que de la prononciation des lettres, groupes de lettres et mots écrits, s’agissant de la correspondance entre aspects écrit et parlé de la langue.

Markov model

In probability theory, a Markov model is a stochastic model used to model pseudo-randomly changing systems. It is assumed that future states depend only on the current state, not on the events that occurred before it (that is, it assumes the Markov property). Generally, this assumption enables reasoning and computation with the model that would otherwise be intractable. For this reason, in the fields of predictive modelling and probabilistic forecasting, it is desirable for a given model to exhibit the Markov property.

Modèle de Markov caché

Un modèle de Markov caché (MMC, terme et définition normalisés par l’ISO/CÉI [ISO/IEC 2382-29:1999]) — (HMM)—, ou plus correctement (mais non employé) automate de Markov à états cachés, est un modèle statistique dans lequel le système modélisé est supposé être un processus markovien de paramètres inconnus. Contrairement à une chaîne de Markov classique, où les transitions prises sont inconnues de l'utilisateur mais où les états d'une exécution sont connus, dans un modèle de Markov caché, les états d'une exécution sont inconnus de l'utilisateur (seuls certains paramètres, comme la température, etc.