Language Weaver - Research

Recherche

« Je vais maintenant passer au décodage. »

Rejoignez-nous
Language Weaver - Research

Chez Language Weaver, nous bénéficions d'une longue et riche histoire de recherche et de développement dans le domaine du traitement du langage naturel. Notre équipe multinationale aux multiples facettes mène des recherches de pointe. À court terme, le but est de faire progresser la science. À long terme, il s'agit d'introduire ce travail dans nos outils et technologies qui aident nos clients à mieux comprendre leur contenu et à créer plus efficacement de nouveaux contenus. 

Voici quelques-uns des domaines dans lesquels notre équipe réalise activement des travaux de recherche et de développement : 

  • Traduction automatique neuronale 
  • Estimation de la qualité de la traduction automatique 
  • Résumé multilingue 
  • Reconnaissance d'entités nommées 
  • Analyse d'opinion 
  • Création de texte 
  • Simplification du texte et reformulation 
  • Réponses aux questions 
  • Analyse des rubriques et des styles 

Nous assistons régulièrement à des conférences et y faisons des présentations. Nous publions également nos travaux dans des cadres reconnus tels que NAACL, (E)ACL, EMNLP, MT Summit, et autres. Vous pouvez voir certaines de nos publications sélectionnées ci-dessous.

La vie à Language Weaver

Le meilleur aspect du travail à Language Weaver est que ce n'est jamais ennuyeux ! Notre équipe n'est jamais figée sur la même tâche ou ne concentre pas ces recherches constamment sur le même sujet, parce que nous travaillons toujours avec de nouveaux clients sur de nouvelles données, des langues intéressantes, ainsi que sur de vastes domaines et applications. 

Il existe toujours une opportunité d'affiner et d'élargir les compétences, en essayant de nouvelles techniques dans le but de résoudre les problèmes du monde réel pour les clients qui traitent et traduisent des milliards de mots chaque année. Parce que notre équipe est issue d'un si large éventail de milieux, nous apprenons aussi beaucoup les uns des autres. 

Comptant des sites à Los Angeles, Cluj-Napoca, Dublin et d'autres lieux en Europe, notre équipe de scientifiques, d'ingénieurs et de linguistes est dynamique, enthousiaste et dotée de connaissances solides dans le traitement du langage naturel. Elle souhaite également élargir les horizons. Entre nous, nous parlons presque autant de langues que nos moteurs de traduction automatique !

En plus des tâches quotidiennes, nous participons également à un groupe de lecture hebdomadaire où nous présentons nos propres recherches et d'autres articles de premier plan dans le domaine. En plus de cela, nous publions un blog hebdomadaire : « The Neural MT Weekly », qui est consulté par des milliers de lecteurs chaque semaine !

Vous souhaitez rejoindre notre équipe ? Contactez-nous !

Publications 

Publications sélectionnées :    

2021 :    

Roemmele M., Sidhpura D., DeNeefe S. et Tsou L. (2021). AnswerQuest: A System for Generating Question-Answer Items from Multi-Paragraph Documents. 16th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2021), Demo Track.    

2020 :    

Saunders D., Feely W. et Byrne B. (2020). Inference-only sub-character decomposition improves translation of unseen logographic characters, Proceedings of the 7th Workshop on Asian Translation.    

2019 :    

Feely W., Hasler E. et de Gispert A. (2019). Controlling Japanese Honorifics in English-to-Japanese Neural Machine Translation. Proceedings of the 6th Workshop on Asian Translation.    

Saunders D., Stahlberg F., de Gispert A. et Byrne B. (2019). Domain Adaptive Inference for Neural Machine Translation. Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics (ACL).    

Roemmele M. (2019). Identifying Sensible Lexical Relations in Generated Stories. Workshop on Narrative Understanding at the 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL 2019)    

2018 :    

Iglesias G., Tambellini W., de Gispert A., Hasler E. et Byrne B. (2018). Accelerating NMT Batched Beam Decoding with LMBR Posteriors for Deployment. Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT).    

Hasler E., de Gispert A., Iglesias G. et Byrne B. (2018). Neural Machine Translation Decoding with Terminology Constraints. Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT)    

Saunders D., Stahlberg F., de Gispert A. et Byrne B. (2018). Multi-representation Ensembles and Delayed SGD Updates Improve Syntax-based NMT. Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (ACL).    

Stahlberg F., de Gispert A. et Byrne B. (2018). The University of Cambridge's Machine Translation Systems for WMT18. Proceedings of the Conference of Machine Translation (WMT).    

2017 :    

Hasler E., de Gispert A., Stahlberg F., Waite A. et B. Byrne (2017). Source sentence simplification for statistical machine translation. Computer Speech & Language, vol 45, pps 221-235.    

Stahlberg F., de Gispert A., Hasler E. et Byrne B. (2017). Neural Machine Translation by Minimising the Bayes-risk with Respect to Syntactic Translation Lattices. Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics (EACL).    

Hasler E., Stahlberg F., Tomalin M. de Gispert A. et Byrne B. (2017). A Comparison of Neural Models for Word Ordering. International Conference on Natural Language Generation (INLG).    

2015 :  

Gispert A., Iglesias G., Byrne W., (2015) Fast and Accurate Preordering for SMT using Neural Networks, North American Chapter of the Association for Computational Linguistics: Human Language Technologies    

Dreyer M. et Graehl J. (2015) hyp: A Toolkit for Representing, Manipulating, and Optimizing Hypergraphs, North American Chapter of the Association for Computational Linguistics: Human Language Technologies    

Dreyer M. et Dong D. (2015) APRO : All-Pairs Ranking Optimization for MT Tuning, North American Chapter of the Association for Computational Linguistics: Human Language Technologies    

2014 :    

May J., Benjira Y., Echihabi A. (2014) An Arabizi-English Social Media Statistical Machine Translation System, Association for Machine Translation in the Americas    

Jehl L., Gispert A., Hopkins M., Byrne M. (2014) Source-side preordering for translation using logistic regression and depth-first branch-And-bound search, European Chapter of the Association for Computational Linguistics, (pp 239-248).    

2013 :    

Hopkins M. et May J. (2013) Models of Translation Competitions. Proceedings of ACL, 2013.  

Munteanu D. S. et Marcu D. (2013) Exploiting Comparable Corpora. In Building and Using Comparable Corpora, Springer Publications.    

2012 :  

Soricut R., Bach N. et Wang Z. (2012) The SDL Language Weaver Systems in the WMT12 Quality Estimation Shared Task, InProceedings of the Seventh Workshop on Statistical Machine Translation (WMT 2012), June 2012, Montreal, Quebec, Canada.   

Dreyer M. et Marcu D. (2012) HyTER: Meaning-Equivalent Semantics for Translation Evaluation, In Proceedings of the 2012 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Montreal, Canada.    

2011 :    

Hopkins M. et May J. (2011) Tuning as Ranking. Proceedings of EMNLP, 2011.    

Hopkins M., Langmead G. et Vo T. (2011) Extraction Programs: A Unified Approach to Translation Rule Extraction. Proceedings of WMT, 2011.    

2010 :    

Soricut R. et Echihabi A. (2010) TrustRank: Inducing Trust in Automatic Translations via Ranking, Association for Computational Linguistics Conference, (pp 612-621).    

Hopkins M. et Langmead G. (2010) SCFG Decoding Without Binarization. Proceedings of EMNLP, 2010.    

Wang W., May J., Knight K. et Marcu D. (2010) Re-Structuring, Re-Labeling, and Re-Aligning for Syntax-based Machine Translation, Computational Linguistics. (36.2).    

2009 :    

Hopkins M. et Langmead G. (2009) Cube Pruning as Heuristic Search. Proceedings of EMNLP, 2009.    

Yamada K. et Muslea I. (2009). Re-ranking for large-scale statistical machine translation, Learning Machine Translation, (pp 151-169)    

2007 :   

Wang W., Knight K. et Marcu D. (2007) Binarizing Syntax Trees to Improve Syntax-Based Machine Translation Accuracy. Proceedings of EMNLP-07, pp. 746-754, Prague.    

2006 :    

Marcu D., Wang W., Echihabi A. et Knight K. (2006) SPMT: Statistical Machine Translation with Syntactified Target Language Phrases", Empirical Methods in Natural Language Conference, (pp 44-52).    

Huang B. et Knight K. (2006). Relabeling Syntax Trees to Improve Syntax-Based Machine Translation Quality. Proceedings of HLT-NAACL, 2006.

Abonnez-vous à The Neural MT Weekly

Loading...