Алгоритм DELPHI на основе анализа научных статей предсказывает, какие идеи ученых "выстрелят", а какие — канут в лету.
Система искусственного интеллекта, созданная исследователями из Массачусетского технологического института (MIT), изучая факты, аргументы, идеи, результаты тестов, изложенные в разного рода научных публикациях, способна предсказать будущее развития технологий и направлений науки. Во время тестирования система, получившая название DELPHI, смогла идентифицировать и проанализировать все новаторские идеи из сферы биотехнологий, изложенные в статьях, опубликованных в течение года. Ученые Джеймс Вайс и Джозеф Джейкобсон из MIT использовали DELPHI, чтобы детально изучить 50 недавно изданных научных работ, которые, по их прогнозам, будут иметь большое влияние в 2023 году. Темы, затронутые в докладах, касаются ДНК-нанороботов, используемых для лечения рака, литий-кислородных батарей с высокой плотностью энергии и химического синтеза, осуществляемого при помощи нейронных сетей. Исследователи считают, что данный ИИ-инструмент может помочь их коллегам эффективнее использовать финансирование для научных исследований. Иными словами, вместо того, чтобы искать иголку в стогу сена в попытках определить, какая из идей "выстрелит", они могут воспользоваться алгоритмами ИИ, которые четко определят дальнейшее направление работы. Инструмент будет полезен правительствам, благотворительным организациям и венчурным компаниям, поддерживающим науку.
"По сути, наш алгоритм изучает историю науки, а затем сопоставляет данные "из прошлого" с данными из новых публикаций, чтобы отслеживать развитие той или иной идеи или теории", — пишет Вайс в своей статье для Nature Biotechnology. "Отслеживая то, как распространялись идеи, мы можем предсказать, насколько вероятно, что они станут "вирусными" и значимыми среди академического сообщества".
Как работает инновационная ИИ-система
Алгоритм машинного обучения, разработанный Вейсом и Джейкобсоном, способен обработать огромное количество научной цифровой информации, оцифрованной и опубликованной в Интернете, начиная с 1980-х годов. В своем поиске и анализе алгоритм не опирается на такой показатель, как количество цитирований. Он обучен работе с сетью метаданных журнальных статей с тем, чтобы выявить закономерности и то, как они распространялись в научной среде. Он учитывает и такие данные, как имена и ученые степени авторов, научные учреждения, в которых они работали. Сортируя данные, алгоритм находит "точки соприкосновения", формируя из них "скелеты" идей. На эти "скелеты" он нанизывает все больше данных, в итоге они обрастают своеобразной информационной оболочкой. Чем плотнее оболочка, тем успешнее была идея.
Система занимается не только изучением прошлого, но и прогнозированием будущего. DELPHI стремится определить, какие из высказанных идей будут наиболее эффективными и поддерживаемыми в ближайшие пять лет. Обычно, статьи, содержащие такие прогрессивные мысли, составляют 35% от общего количества обработанного материала.
Статьи, которые вирусно распространились за пределы своих дисциплин и небольших научных сообществ, воспринимаются DELPHI, как "очень влиятельные". К примеру, две статьи могут иметь одинаковое количество цитирований, но более влиятельной будет та, которая охватила бОльшую аудиторию. Воспользовавшись данными, предоставленными алгоритмом, ученые смогут быстрее узнать о работах друг друга, и даже начать совместные исследования. В таком случае у них повысятся шансы получить финансирование, если им предстоит работать над важными междисциплинарными проблемами.
В отличие от поисковых систем, выдающих на первые страницы наиболее цитируемые материалы, DELPHI способна выявлять настоящие "жемчужины" среди материалов, не получивших достаточного количества цитирований, но при этом не менее важных и полезных чем материалы с высокой цитируемостью. Такие "жемчужины" составляют 60% от общего количества найденных тематических текстов.
"Развитие фундаментальных исследований заключается в том, чтобы изучить множество вариантов и, в итоге, выбрать и реализовать наилучший, — говорит Джейкобсон. — Мы хотим сделать этот процесс поиска более масштабным, эффективным и быстрым".
"В течение года после публикации мы начали выявлять те самые "скрытые жемчужины", — материалы, которые в будущем окажут значительное влияние на развитие того или иного направления", — комментирует Вайс.
Однако он предупреждает, что DELPHI не способна точно предсказывать будущее.
В чем польза от ИИ-системы DELPHI
Исследователи надеются, что искусственный интеллект DELPHI предложит менее предвзятый способ оценки воздействия статей, поскольку, как показали прошлые исследования, не исключено манипулирование показателями вроде цитирования и импакт-фактора научных изданий.
"Мы надеемся, что наша разработка поможет в поиске наиболее достойных исследований и исследователей, независимо от того, в каких именно учреждениях они работают и в каких журналах публиковались", — говорит Вайс.
Однако пользователи должны помнить о предвзятости AI-систем, добавляет он. "Нам необходимо постоянно осознавать, что и данные, и алгоритмы, их обрабатывающие — несовершенны. Мы хотим, чтобы DELPHI помогал находить наилучшие исследования наименее предвзятым образом, поэтому нам нужно быть осторожными, наши модели не учатся предсказывать будущее воздействие исключительно на основе неоптимальных показателей, таких как количество цитирований авторов или авторитетность учреждений, в которых они работают".
Новая система искусственного интеллекта может стать мощным инструментом, который поможет сделать финансирование научных экспериментов более эффективным и действенным, и, возможно, его можно будет использовать для создания новых видов финтех-продуктов для инвестиций в науку. Это то, о чем Вайс много думал, опираясь на собственный опыт запуска венчурных фондов и лабораторных инкубаторов для биотехнологических стартапов.
"Я все больше осознавал, что инвесторы, включая меня, постоянно ищут новые компании в одних и тех же местах и имея одни и те же требования и ожидания", — говорит он. "Я подумал, что должен быть способ находить новых людей и новые технологические наработки, и я верю, что машинное обучение может помочь в этом, чтобы, в итоге, реализовать весь этот неизведанный потенциал".
Рекомендуем ознакомиться с нашим материалом Восстание машин. Стоит ли людям опасаться искусственного интеллекта?