Переводчик от компании Яндекс продолжает удивлять своими возможностями. Если в январе прошлого года сервис заговорил по-эльфийски, то теперь он освоил ещё более редкий язык. Речь идет, как ни странно, об эмодзи.
По заявлению разработчиков, эмодзи можно считать отдельным языком с пиктографическим письмом, как у древних шумеров. Для работы с этим "языком", привычный подход к изучению, связанный с анализом параллельных текстов, уже не работает. Поэтому, Переводчик использует всевозможные сайты, на которых собраны различные эмодзи и их описания, в качестве словарей. Разумеется, для одного эмодзи может существовать несколько вариантов "толкования", поэтому результат обратного перевода может удивить пользователя.
Стоит отметить, что Переводчик может переводить на эмодзи и обратно целые фразы. Для этого, они разбиваются на отдельные слова и словосочетания. Затем, каждый элемент представляется в виде вектора - т.е., записывается в виде набора чисел. Аналогичная операция производится и с описаниями эмодзи. После этого, остается лишь сопоставить полученные векторные представления и выбрать те из них, которые находятся максимально близко друг другу, чтобы подобрать наиболее точное смысловое соответствие между текстом и эмодзи.
Опробовать нововведение могут все желающие. Перевод на эмодзи и обратно доступен в веб-версии сервиса Яндекс.Переводчик, а также в соответствующих мобильных приложениях.