 |
Internationalization (i18n)
|
|
¿Qué? pour l'identification AUTOMATIQUE des
langues et de l'encodage des jeux de caractères dans
les applications logicielles
Qu'il s'agisse de systèmes de gestion des relations
avec la clientèle, de gestion du savoir, de vérification
de l'orthographe, de bases de données et de traduction
automatique, ¿Qué? est la MEILLEURE solution
qui soit pour accroître la valeur de vos applications
logicielles.
À l'heure de la mondialisation, de plus en plus
d'entreprises font des affaires à l'échelle
planétaire dans un nombre croissant de langues. Avec
l'essor d'Internet, nous avons accès quotidiennement
à des documents écrits dans une multitude
de langues. Même si la prédominance de l'anglais
est évidente, on retrouve actuellement de nombreuses
autres langues dans Internet et, à plus forte raison,
dans les intranets locaux. Il est donc essentiel maintenant
de pouvoir identifier la langue et l'encodage des jeux de
caractères afin de traiter correctement les documents.
¿Qué?, notre identificateur des langues et
de l'encodage des jeux de caractères, est une composante
importante de tout système internationalisé
de recherche documentaire, de traduction automatique, de
vérification orthographique ou, encore, de synthèse
vocale. Les applications sont innombrables.
De tous les identificateurs offerts sur le marché,
¿Qué? est le plus rapide et le plus complet.
Actuellement, il peut identifier correctement 29
langues et plus de 101 paires de langues et d'encodages.
D'autres langues, plus rares, sont offertes sur commande.
La technologie révolutionnaire de notre identificateur
est destinée principalement aux concepteurs d'applications
et aux intégrateurs. Ceux-ci peuvent obtenir le système
d'identification sous licence afin de l'incorporer dans
divers produits tels que des navigateurs Internet, des logiciels
de traitement de texte, des systèmes de gestion des
relations avec la clientèle, des moteurs de recherche
documentaire ou autres.
Vous pouvez en faire l'essai immédiatement
en remplissant ce formulaire.
Grâce à une technologie de pointe extrêmement
précise, ce système d'identification n'a besoin
que d'une centaine d'octets pour identifier la langue et
le jeu de caractères d'un document. ¿Qué?
reconnaît simultanément la langue et le jeu
de caractères, contrairement à certains logiciels
qui reconnaissent la langue d'un document en recherchant
les occurrences des mots. Il ne faut pas oublier que le
concept de mots n'existe pas dans le cas de nombreuses langues,
et qu'il est donc difficile de retrouver des chaînes
de lettres comme telles.
|
|
 |
Avantages de ¿Qué?
:
- Rapidité et précision
- Couverture d'un grand nombre
de langues et d'encodages
- Multiplate-forme
- Reconnaissance des langues
et de l'encodage, ce que d'autres produits n'offrent
pas
- Reconnaissance des langues
et de l'encodage des jeux de caractères avec
seulement 100 caractères ou plus
- Diminution des interventions
humaines dans le classement de documents multilingues
|
|
Illustration simplifiée du processus utilisé
par ¿Qué? pour identifier une langue et un
jeu de caractères
|
|
La reconnaissance de la langue et du jeu de caractères
peut servir dans de multiples applications. Ainsi, un système
informatique qui est utilisé pour manipuler des documents
dans Internet doit, en principe, pouvoir identifier la langue
de chaque document et savoir comment elle est codée.
Si le système ne connaît pas le jeu de caractères,
il ne pourra pas l'afficher ou l'imprimer correctement.
De plus, s'il ne reconnaît pas la langue des documents
d'une base documentaire, il pourra difficilement y effectuer
une recherche intelligente. Par exemple, lorsqu'un utilisateur
effectue une recherche pour le mot français lime
(l'outil), le système devrait éviter d'inclure,
dans les résultats de la recherche, des documents
qui contiennent le mot anglais lime (un fruit). En outre,
s'il ne peut pas identifier la langue d'un document, il
pourra difficilement effectuer une traduction automatique
ou une synthèse vocale.
¿Qué? est offert sous forme de bibliothèques
statique ou dynamique pour les plate-formes suivantes :
AIX, HP-UX, Linux, Macintosh, SGI, Solaris et Windows. Une
description de l'API ainsi qu'une foire aux questions (FAQ)
sont disponibles. Communiquez
avec Alis pour obtenir ces renseignements.
|
|
Autres produits et services
d'internationalisation
:
- Batam
MC: Bibliothèque d'internationalisation
- Florès
MC: Conversion des jeux de caractères
|
|
Combinaisons de langues et d'encodages pris en charge
par ¿Qué?
| Langue |
ISO 639
code |
Jeux de caractères reconnus |
| Albanais |
sq |
cp1252, cp850, Macintosh, utf8 |
| Allemand |
de |
cp1252, cp850, Macintosh, utf8 |
| Anglais |
en |
cp1252, utf8 |
| Arabe |
ar |
cp1256, ISO 8859-6, utf8 |
| Basque |
eu |
cp1252, cp850, Macintosh, utf8 |
| Bulgare |
bg |
cp1251, ISO 8859-5, utf8 |
| Chinois |
zh |
gb2312, hz, big5, utf8 |
| Coréen |
ko |
ks c 5601, ISO 2022-kr, utf8 |
| Croate |
sh |
cp1250, ISO 8859-2, Macintosh-Croat, utf8 |
| Danois |
da |
cp1252, cp850, Macintosh, utf8 |
| Espagnol |
es |
cp1252, cp850, Macintosh, utf8 |
| Estonien |
et |
ISO 8859-4, utf8 |
| Finnois |
fi |
cp1252, cp850, Macintosh, utf8 |
| Français |
fr |
cp1252, cp850, Macintosh, utf8 |
| Grec |
el |
cp1253, cp869, ISO 8859-7, Macintosh-Greek, utf8 |
| Hébreu |
he |
ISO 8859-8 |
| Hongrois |
hu |
cp1250, cp852, utf8 |
| Italien |
it |
cp1252, cp850, Macintosh, utf8 |
| Japonais |
ja |
euc-jp, ISO 2022-jp, shift-jis, utf8 |
| Malais |
ms |
cp1252, cp850, Macintosh, utf8 |
| Dutch |
nl |
cp1252, cp850, Macintosh, utf8 |
| Norvégien |
no |
cp1252, cp850, Macintosh, utf8 |
| Polonais |
pl |
cp1252, ISO 8859-2, utf8 |
| Portugais |
pt |
cp1252, cp850, Macintosh, utf8 |
| Russe |
ru |
cp1251, ISO 8859-5, koi8-r, utf8 |
| Suédois |
sv |
cp1252, cp850, Macintosh, utf8 |
| Tchèque |
cs |
cp1250, ISO 8859-2, utf8 |
| Thai |
th |
tis 620, utf8 |
| Turc |
tr |
cp853, ISO 8859-9, utf8 |
|
|
Applications utilisant déjà ¿Qué?
:
- Gestion des relations avec la clientèle
- Gestion du savoir
- Moteurs de recherche
- Navigateurs Internet
- Filtres Web
- Traduction automatique
|
|
|
|
|