Серед нових мов – такі широко поширені, як кантонська та панджабі (шахмукхі), а також мови малих корінних народів, деякі з яких перебувають у процесі відродження. Близько чверті нових мов походять з Африки, що є найбільшим розширенням африканських мов у Google сьогодні. Серед них фон, кіконго, луо, га, сваті, венда та волоф.
Однією з помітних мов є кримськотатарська, тюркська мова, класифікована ЮНЕСКО як така, що потребує додаткового захисту. Після того, як у січні 2023 року Україна створила Національну комісію з питань кримськотатарської мови, до неї знову повернулася увага.
Інші важливі доповнення включають:
- Афар: Тональна мова, якою розмовляють у Джибуті, Еритреї та Ефіопії, завдяки значному внеску громади волонтерів.
- Менська: Кельтська мова острова Мен, відроджена після майже повного зникнення у 1974 році.
- Нко: Стандартизована форма західноафриканської мови мандінка з унікальним алфавітом, винайденим у 1949 році.
- Тамазігська (амазігська): Берберська мова з Північної Африки, що має письмові форми як латиницею, так і шрифтом тифінаг.
- Ток-пісін: Креольська мова на основі англійської, що слугує мовою міжетнічного спілкування в Папуа-Новій Гвінеї.
Як і чому Google додає нові мови?
Підхід Google до додавання нових мов передбачає надання пріоритету найпоширенішим різновидам і тісну співпрацю з лінгвістичними експертами та носіями мов. Це гарантує, що переклади будуть максимально точними та корисними. Наприклад, модель ромської мови створює текст, найбільш близький до південно-волоської ромської мови, але з елементами інших діалектів.
Інтеграція PaLM 2 дозволяє ефективніше вивчати близькоспоріднені мови, такі як мови, подібні до хінді (авадхі та марваді), та французькі креольські мови (сейшельська креольська та маврикійська креольська). З розвитком технологій Google планує й надалі розширювати підтримку більшої кількості мовних різновидів і правописних стандартів, що сприятиме подальшому розширенню глобального охоплення та доступності Google Перекладача.