Internationalization (i18n)


¿Qué? pour l'identification AUTOMATIQUE des langues et de l'encodage des jeux de caractères dans les applications logicielles

Qu'il s'agisse de systèmes de gestion des relations avec la clientèle, de gestion du savoir, de vérification de l'orthographe, de bases de données et de traduction automatique, ¿Qué? est la MEILLEURE solution qui soit pour accroître la valeur de vos applications logicielles.

À l'heure de la mondialisation, de plus en plus d'entreprises font des affaires à l'échelle planétaire dans un nombre croissant de langues. Avec l'essor d'Internet, nous avons accès quotidiennement à des documents écrits dans une multitude de langues. Même si la prédominance de l'anglais est évidente, on retrouve actuellement de nombreuses autres langues dans Internet et, à plus forte raison, dans les intranets locaux. Il est donc essentiel maintenant de pouvoir identifier la langue et l'encodage des jeux de caractères afin de traiter correctement les documents. ¿Qué?, notre identificateur des langues et de l'encodage des jeux de caractères, est une composante importante de tout système internationalisé de recherche documentaire, de traduction automatique, de vérification orthographique ou, encore, de synthèse vocale. Les applications sont innombrables.

De tous les identificateurs offerts sur le marché, ¿Qué? est le plus rapide et le plus complet. Actuellement, il peut identifier correctement 29 langues et plus de 101 paires de langues et d'encodages. D'autres langues, plus rares, sont offertes sur commande.

La technologie révolutionnaire de notre identificateur est destinée principalement aux concepteurs d'applications et aux intégrateurs. Ceux-ci peuvent obtenir le système d'identification sous licence afin de l'incorporer dans divers produits tels que des navigateurs Internet, des logiciels de traitement de texte, des systèmes de gestion des relations avec la clientèle, des moteurs de recherche documentaire ou autres.

Vous pouvez en faire l'essai immédiatement
en remplissant ce formulaire.

Grâce à une technologie de pointe extrêmement précise, ce système d'identification n'a besoin que d'une centaine d'octets pour identifier la langue et le jeu de caractères d'un document. ¿Qué? reconnaît simultanément la langue et le jeu de caractères, contrairement à certains logiciels qui reconnaissent la langue d'un document en recherchant les occurrences des mots. Il ne faut pas oublier que le concept de mots n'existe pas dans le cas de nombreuses langues, et qu'il est donc difficile de retrouver des chaînes de lettres comme telles.

 

Avantages de ¿Qué? :
  • Rapidité et précision
  • Couverture d'un grand nombre de langues et d'encodages
  • Multiplate-forme
  • Reconnaissance des langues et de l'encodage, ce que d'autres produits n'offrent pas
  • Reconnaissance des langues et de l'encodage des jeux de caractères avec seulement 100 caractères ou plus
  • Diminution des interventions humaines dans le classement de documents multilingues

 


Illustration simplifiée du processus utilisé par ¿Qué? pour identifier une langue et un jeu de caractères

 

La reconnaissance de la langue et du jeu de caractères peut servir dans de multiples applications. Ainsi, un système informatique qui est utilisé pour manipuler des documents dans Internet doit, en principe, pouvoir identifier la langue de chaque document et savoir comment elle est codée. Si le système ne connaît pas le jeu de caractères, il ne pourra pas l'afficher ou l'imprimer correctement. De plus, s'il ne reconnaît pas la langue des documents d'une base documentaire, il pourra difficilement y effectuer une recherche intelligente. Par exemple, lorsqu'un utilisateur effectue une recherche pour le mot français lime (l'outil), le système devrait éviter d'inclure, dans les résultats de la recherche, des documents qui contiennent le mot anglais lime (un fruit). En outre, s'il ne peut pas identifier la langue d'un document, il pourra difficilement effectuer une traduction automatique ou une synthèse vocale.

¿Qué? est offert sous forme de bibliothèques statique ou dynamique pour les plate-formes suivantes : AIX, HP-UX, Linux, Macintosh, SGI, Solaris et Windows. Une description de l'API ainsi qu'une foire aux questions (FAQ) sont disponibles. Communiquez avec Alis pour obtenir ces renseignements.

 

 

 

Autres produits et services
d'internationalisation :
  • Batam MC: Bibliothèque d'internationalisation
  • Florès MC: Conversion des jeux de caractères

 

Combinaisons de langues et d'encodages pris en charge par ¿Qué?

Langue ISO 639
code
Jeux de caractères reconnus
Albanais sq cp1252, cp850, Macintosh, utf8
Allemand de cp1252, cp850, Macintosh, utf8
Anglais en cp1252, utf8
Arabe ar cp1256, ISO 8859-6, utf8
Basque eu cp1252, cp850, Macintosh, utf8
Bulgare bg cp1251, ISO 8859-5, utf8
Chinois zh gb2312, hz, big5, utf8
Coréen ko ks c 5601, ISO 2022-kr, utf8
Croate sh cp1250, ISO 8859-2, Macintosh-Croat, utf8
Danois da cp1252, cp850, Macintosh, utf8
Espagnol es cp1252, cp850, Macintosh, utf8
Estonien et ISO 8859-4, utf8
Finnois fi cp1252, cp850, Macintosh, utf8
Français fr cp1252, cp850, Macintosh, utf8
Grec el cp1253, cp869, ISO 8859-7, Macintosh-Greek, utf8
Hébreu he ISO 8859-8
Hongrois hu cp1250, cp852, utf8
Italien it cp1252, cp850, Macintosh, utf8
Japonais ja euc-jp, ISO 2022-jp, shift-jis, utf8
Malais ms cp1252, cp850, Macintosh, utf8
Dutch nl cp1252, cp850, Macintosh, utf8
Norvégien no cp1252, cp850, Macintosh, utf8
Polonais pl cp1252, ISO 8859-2, utf8
Portugais pt cp1252, cp850, Macintosh, utf8
Russe ru cp1251, ISO 8859-5, koi8-r, utf8
Suédois sv cp1252, cp850, Macintosh, utf8
Tchèque cs cp1250, ISO 8859-2, utf8
Thai th tis 620, utf8
Turc tr cp853, ISO 8859-9, utf8

 

Applications utilisant déjà ¿Qué? :

  • Gestion des relations avec la clientèle
  • Gestion du savoir
  • Moteurs de recherche
  • Navigateurs Internet
  • Filtres Web
  • Traduction automatique