Омар — больше чем брат!
22.11.2016 Вторник 07:08
Приятно наблюдать как технологии продвигаются вперёд. Помню, лет шесть назад мы ездили с друзьями в Амстердам, и мне хорошо запомнился разговор, зашедший между нами в одном из кафе. Мы рассуждали о том, что крайне полезным применением элементов искусственного интеллекта стал бы автоматический перевод с одного человеческого языка на другой. В этом контексте кто-то упомянул, что видел или читал про то, что какая-то компания разрабатывает программу, которая позволяет, наведя камеру смартфона на надпись на иностранном языке увидеть вместо этой надписи её перевод. Причём, прямо на изображении, то есть перевод накладывается "сверху" на оригинальный текст и даже рендерится шрифтом, похожим по характеристикам на исходный. Таким образом, смотришь на реальность непосредственно собственными глазами — ничего непонятно, а смотришь через экран смартфона — все надписи на знакомом языке! Профит!
Хорошо помню, как мы обсуждали техническую реализуемость такой фичи. В частности, было высказано мнение о том, что она принципиально реализуема, хотя, возможно, потребует производительности процессора, которая пока ещё не доступна смартфонам, хотя, с другой стороны, и не за горами. В частности, алгоритм для реализации этой идеи должен был бы в режиме реального времени выполнять три задачи: распознавание текста, перевод и наложение перевода на исходное изображение. Каждая из этих задач совсем не тривиальна. А выполнять их "на лету" ещё сложнее.
Прошло шесть лет, и мы — даже примерно в той же компании, только теперь уже в Бостоне — имели возможность лицезреть практическую реализацию этой идеи. Мы сидели в китайском ресторане (или забегаловке — мнения об этом заведении разнятся) и, увидев надписи иероглифами, вспомнили тот разговор. Тут же на айфоны всех участников посиделки было установлено приложение Google Translate, и камеры устройств устремили свой беспристрастный взгляд на китайские закорючки.
И вот результат. Это оригинал:
А это то, что отображалось на экране айфона:
То бишь, на первой фотке не пойми что, а на второй написано "spicy lobster", то есть, по-английски — "острый омар"! Причём, наложенный перевод всё время оставался прямо над оригинальной надписью, закрывая её собой даже при движении камеры.
Будущее наступило!
P.S. Конечно, искусственному интеллекту есть ещё куда улучшаться. В частности, на втором скрине видно, что алгоритм попытался перевести с китайского на английский то, что и так написано на английском (видно в нижней части кадра). Ну, не без косяков, конечно. Но всё равно, воодушевляет.
P.P.S. Кстати, перевод с английского на английский у Гуглотранслейта получился презабавный. "Омар — больше чем брат!". Во как.