Publication

Acoustic data-driven grapheme-to-phoneme conversion in the probabilistic lexical modeling framework

Concepts associés (22)

En phonologie, domaine de la linguistique, un phonème est la plus petite unité discrète (ou distinctive, c'est-à-dire permettant de distinguer des mots les uns des autres) que l'on puisse isoler par segmentation dans la chaîne parlée. Un phonème est en réalité une entité abstraite, qui peut correspondre à plusieurs sons. Il est en effet susceptible d'être prononcé de façon différente selon les locuteurs ou selon sa position et son environnement au sein du mot (voir allophone) : les phones sont les différentes réalisations d'un phonème.

Graphème

En linguistique, un graphème est la plus petite entité d'un système d'écriture. C'est l’unité graphique correspondant en général à l'unité orale qu'est le phonème (contre-exemple en français le graphème complexe qui renvoie à deux phonèmes). Contrairement à l'unité « lettre », le graphème correspond ainsi mieux à la phonologie d'une langue. Cela est particulièrement visible dans le cas des graphèmes dits « complexes ». Les graphèmes peuvent se distinguer en deux sous-types : graphème simple : graphème composé d'une lettre ; graphème complexe : graphème composé de deux ou trois lettres.

Phonemic orthography

A phonemic orthography is an orthography (system for writing a language) in which the graphemes (written symbols) correspond to the phonemes (significant spoken sounds) of the language. Natural languages rarely have perfectly phonemic orthographies; a high degree of grapheme–phoneme correspondence can be expected in orthographies based on alphabetic writing systems, but they differ in how complete this correspondence is.

Modèle de Markov caché

Un modèle de Markov caché (MMC, terme et définition normalisés par l’ISO/CÉI [ISO/IEC 2382-29:1999]) — (HMM)—, ou plus correctement (mais non employé) automate de Markov à états cachés, est un modèle statistique dans lequel le système modélisé est supposé être un processus markovien de paramètres inconnus. Contrairement à une chaîne de Markov classique, où les transitions prises sont inconnues de l'utilisateur mais où les états d'une exécution sont connus, dans un modèle de Markov caché, les états d'une exécution sont inconnus de l'utilisateur (seuls certains paramètres, comme la température, etc.

Orthographe

En linguistique, le terme orthographe (du latin orthographia, lui-même issu du grec , composé de , « droit, correct », et de , « écrire ») dénomme un système de règles concernant l'écriture d'une langue, faisant partie de son standard, en comparaison duquel on juge comme correctes ou incorrectes les formes que les utilisateurs réalisent en écrivant cette langue.

Transparence orthographique

La transparence orthographique désigne, pour une langue donnée, le degré de correspondance entre l'orthographe et la phonologie de la langue, c'est-à-dire la correspondance entre la façon dont on écrit la langue et dont on la prononce. Une langue parfaitement transparente est une langue dans laquelle la correspondance entre graphèmes et phonèmes est consistante : à un phonème (plus petite unité prononçable d'un mot) correspond un et un seul graphème (lettre ou ensemble de lettres associés à un son de la langue, comme « a » ou « ch ») et réciproquement.

Synthèse vocale

La synthèse vocale est une technique informatique de synthèse sonore qui permet de créer de la parole artificielle à partir de n'importe quel texte. Pour obtenir ce résultat, elle s'appuie à la fois sur des techniques de traitement linguistique, notamment pour transformer le texte orthographique en une version phonétique prononçable sans ambiguïté, et sur des techniques de traitement du signal pour transformer cette version phonétique en son numérisé écoutable sur un haut parleur.

Reconnaissance automatique de la parole

vignette|droite|upright=1.4|La reconnaissance vocale est habituellement traitée dans le middleware ; les résultats sont transmis aux applications utilisatrices. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine.

Orthographic transcription

Orthographic transcription is a transcription method that employs the standard spelling system of each target language. Examples of orthographic transcription are "Pushkin" and "Pouchkine", respectively the English and French orthographic transcriptions of the surname "Пу́шкин" in the name Алекса́ндр Пу́шкин (Alexander Pushkin). Thus, each target language (English and French) transcribes the surname according to its own orthography. Contrast with phonetic transcription, phonemic orthography, transliteration, and translation.

Transcription phonétique

Une transcription phonétique est une méthode de transcription plus ou moins formalisée des sons d'une ou plusieurs langues. Cette transcription rend normalement une approximation de la prononciation standard de la langue. Les variantes dialectales et individuelles sont difficiles à rendre dans la transcription. Les variantes d'un même phonème (allophone) sont presque toujours impossibles à rendre. Quelques signes sont à disposition pour rendre les informations paraverbales (pauses, racler, tousser, rire...

Glyphe

vignette|Glyphe de la police Caliban. vignette|Glyphe de la police Caslon Italic. Un glyphe (du grec : ; « ciselure », « gravure ») est une représentation graphique d'un signe typographique, autrement dit d'un caractère (glyphe de caractère) ou d'un accent (glyphe d'accent), ou bien d'une ligature de ces caractères (y compris pour une syllabe ou un mot tout entier, dans les écritures cursives et jointives où on ne peut pas produire facilement et proprement les signes par une simple juxtaposition de plusieurs glyphes conçus séparément).

Categorical distribution

In probability theory and statistics, a categorical distribution (also called a generalized Bernoulli distribution, multinoulli distribution) is a discrete probability distribution that describes the possible results of a random variable that can take on one of K possible categories, with the probability of each category separately specified. There is no innate underlying ordering of these outcomes, but numerical labels are often attached for convenience in describing the distribution, (e.g. 1 to K).

Transcription (linguistique)

La transcription, au sens linguistique, est la représentation systématique du langage sous forme écrite. Certains linguistes considèrent que la seule base de la transcription doit être l’énoncé, même si des textes déjà existants dans un autre système d’écriture peuvent également servir de support.

Morphophonologie

En linguistique, la morphophonologie est une discipline dont le domaine constitue une zone d’interférence de la morphologie et de la phonologie. Elle étudie les facteurs phonologiques qui affectent les morphèmes, respectivement les facteurs morphologiques qui affectent les phonèmes. Ce domaine comprend la constitution phonologique des morphèmes, les différences phonologiques entre variantes de morphèmes et les changements phonologiques dans la zone de contact de deux morphèmes.

Système d'écriture

vignette|400px|Carte légendée des systèmes d'écriture dans le monde. Un système d’écriture est un ensemble organisé et plus ou moins standardisé de signes d'écriture permettant la communication des idées. En général, il s'agit de la transcription de la parole énoncée dans une langue parlée : on parle alors de glottographie. Il existe cependant des systèmes transmettant des idées sans l'intermédiaire direct de la parole : on parle alors de sémasiographie, que tous les spécialistes ne s'accordent cependant pas à considérer comme de véritables systèmes d'écriture ; on parle donc également de pré-écriture ou de proto-écriture.

Markov model

In probability theory, a Markov model is a stochastic model used to model pseudo-randomly changing systems. It is assumed that future states depend only on the current state, not on the events that occurred before it (that is, it assumes the Markov property). Generally, this assumption enables reasoning and computation with the model that would otherwise be intractable. For this reason, in the fields of predictive modelling and probabilistic forecasting, it is desirable for a given model to exhibit the Markov property.

Loi de Dirichlet

thumb|right|250px|Plusieurs images de la densité de la loi de Dirichlet lorsque K=3 pour différents vecteurs de paramètres α. Dans le sens horaire à partir du coin supérieur gauche : α=(6, 2, 2), (3, 7, 5), (6, 2, 6), (2, 3, 4). En probabilité et statistiques, la loi de Dirichlet, souvent notée Dir(α), est une famille de lois de probabilité continues pour des variables aléatoires multinomiales. Cette loi (ou encore distribution) est paramétrée par le vecteur α de nombres réels positifs et tire son nom de Johann Peter Gustav Lejeune Dirichlet.

Dirichlet-multinomial distribution

In probability theory and statistics, the Dirichlet-multinomial distribution is a family of discrete multivariate probability distributions on a finite support of non-negative integers. It is also called the Dirichlet compound multinomial distribution (DCM) or multivariate Pólya distribution (after George Pólya). It is a compound probability distribution, where a probability vector p is drawn from a Dirichlet distribution with parameter vector , and an observation drawn from a multinomial distribution with probability vector p and number of trials n.

Character (symbol)

A character is a semiotic sign or symbol, or a glyph - typically a letter, a numerical digit, an ideogram, a hieroglyph, a punctuation mark or another typographic mark. The Ancient Greek word χαρακτήρ ('charaktēr') is an agent noun of the verb χαράσσω (charassō) with a meaning "to sharpen, to whet", and also "to make cake", from a PIE root "cut" also continued in Irish gearr and English gash, which is perhaps an early loan ultimately from the same Greek root.

Romanisation (écriture)

La romanisation (ou latinisation) est la transcription ou la translittération d'une écriture non latine vers une écriture latine. La romanisation de la langue chinoise désigne en même temps cette transcription et le projet ambitieux de “moderniser” la langue en l'écrivant avec l'alphabet latin, sous l'égide de la république de Chine puis de la république populaire de Chine. Coréen : McCune-Reischauer ; romanisation révisée du coréen ; romanisation Yale (voir l'article en anglais).