В программировании одна из наиболее часто встречающихся задач невычислительного характера поиск

НОВОСТНАЯ ФУНКЦИЯ

От Фортрана до arXiv.org. Эти достижения в программировании и платформах отправили биологию. Климатологию и физику в варп-скорость.
  1. Джеффри М. Перкель
карикатура на исследователя сидящего перед гигантским экраном компьютера на котором высвечиваются строки кода

Illustration by Paweł Jońca

В 2019 году команда телескопа Event Horizon дала миру первое представление о том. Как на самом деле выглядит черная дыра. Но изображение светящегося кольцеобразного объекта. Которое представила группа. Не было обычной фотографией. Он был вычислен — математическое преобразование данных. Захваченных радиотелескопами в Соединенных Штатах. Мексике, Чили. Испании и на Южном полюсе1. Команда выпустила программный код. Который она использовала для выполнения этого подвига. Наряду со статьями. Которые документировали ее результаты. Чтобы научное сообщество могло увидеть — и развить — то. Что она сделала.

Это все более распространенная модель. От астрономии до зоологии за каждым великим научным открытием современности стоит компьютер. Майкл Левитт. Вычислительный биолог из Стэнфордского университета в Калифорнии. Получивший в 2013 году Нобелевскую премию по химии за работу над вычислительными стратегиями моделирования химической структуры, отмечает. Что современные ноутбуки имеют примерно в 10 000 раз большую память и тактовую частоту. Чем его лабораторный компьютер в 1967 году. Когда он начал свою работу. “Сегодня в наших руках действительно феноменальные объемы вычислений”. — говорит он.

— Беда в том. Что это все еще требует размышлений.”

Входит ученый-программист. Мощный компьютер бесполезен без программного обеспечения. Способного решать исследовательские вопросы — и исследователей. Которые знают. Как его писать и использовать. “Исследования теперь фундаментально связаны с программным обеспечением”. — говорит Нил Чу Хонг. Директор Института устойчивости программного обеспечения со штаб-квартирой в Эдинбурге. Великобритания. Организации. Занимающейся улучшением разработки и использования программного обеспечения в науке.

— Она пронизывает все аспекты проведения исследований.”

Научные открытия по праву занимают первое место в средствах массовой информации. Но природа на этой неделе смотрит за кулисы. На ключевые фрагменты кода. Которые изменили исследования за последние несколько десятилетий.

Хотя ни один такой список не может быть окончательным. Мы опросили десятки исследователей за последний год. Чтобы разработать разнообразную линейку из десяти программных инструментов. Которые оказали большое влияние на мир науки.

Пионер языка: компилятор Fortran (1957)

Первые современные компьютеры не были удобны для пользователя.

Программирование осуществлялось буквально вручную. Путем соединения блоков схем проводами. Последующие машинные языки и языки ассемблера позволяли пользователям программировать компьютеры в коде, но и те. И другие по-прежнему требовали глубокого знания архитектуры компьютера. Что делало языки недоступными для многих ученых.

Это изменилось в 1950 — х годах с развитием символических языков-в частности. Языка Используя Fortran. Пользователи могли программировать компьютеры с помощью удобочитаемых инструкций. Таких как x = 3 + 5. Затем компилятор превратил такие указания в быстрый и эффективный машинный код.

Компьютер CDC 3600 в Национальном центре атмосферных исследований в Боулдере в 1963 году

Этот компьютер CDC 3600, поставленный в 1963 году в Национальный центр атмосферных исследований в Боулдере. Штат Колорадо. Был запрограммирован с помощью компилятора Fortran.Credit: University Corporation for Atmospheric Research/Science Photo Library

Это все еще было нелегко: в первые дни программисты использовали перфокарты для ввода кода. И для сложной симуляции могли потребоваться десятки тысяч таких карт. Тем не менее. Говорит Сюкуро Манабэ. Климатолог из Принстонского университета в Нью-Джерси. Fortran сделал программирование доступным для исследователей. Которые не были компьютерными учеными.

“Впервые мы смогли запрограммировать [компьютер] сами”. — говорит Манабе. Он и его коллеги использовали этот язык для разработки одной из первых успешных климатических моделей.

Сейчас, в восьмом десятилетии своего существования. Fortran все еще широко используется в моделировании климата. Гидродинамике. Вычислительной химии — любой дисциплине. Которая включает в себя сложную линейную алгебру и требует мощных компьютеров для быстрого вычисления чисел. Полученный код быстр. И есть еще много программистов. Которые знают. Как его написать. Старинные фортранские кодовые базы все еще живы и работают в лабораториях и на суперкомпьютерах по всему миру.

“Старые программисты знали. Что делают”,-говорит Фрэнк Хиральдо. Прикладной математик и специалист по моделированию климата в Военно-морской аспирантуре в Монтерее. Штат Калифорния. “Они были очень внимательны к памяти. Потому что у них было так мало ее.”

Сигнальный процессор: быстрое преобразование Фурье (1965)

Когда радиоастрономы сканируют небо. Они улавливают какофонию сложных сигналов. Меняющихся со временем. Чтобы понять природу этих радиоволн. Они должны увидеть. Как эти сигналы выглядят в зависимости от частоты.

Математический процесс. Называемый преобразованием Фурье. Позволяет исследователям делать это. Проблема в том. Что он неэффективен. Требуя N2 вычислений для набора данных размера N.

В 1965 году американские математики Джеймс Кули и Джон Тьюки разработали способ ускорения этого процесса. Используя рекурсию. Подход к программированию за N логарифмическихшагов 2(N). Скорость увеличивается по мере роста N. Для 1000 пунктов повышение скорости примерно в 100 раз; для 1 миллиона пунктов-в 50 000 раз.

‘Открытие’ было фактически повторным открытием — немецкий математик Карл Фридрих Гаусс разработал его в 1805 году. Но так и не опубликовал. Говорит Ник Трефетен. Математик из Оксфордского университета. Великобритания. Но Кули и Тьюки сделали это. Открыв приложения в области цифровой обработки сигналов. Анализа изображений. Структурной биологии и многого другого. “Это действительно одно из величайших событий в прикладной математике и инженерииFFT был реализован много раз в коде. Один из популярных вариантов называется FFTW. ‘самое быстрое преобразование Фурье на западе

Радиотелескоп в Западной Австралии ночью

Ночной вид части массива Мерчисон-Уайд-Филд. Радиотелескопа в Западной Австралии. Использующего быстрые преобразования Фурье для сбора данных.Кредит: Джон Голдсмит/Небесные видения

Пол Адамс, который руководит отделом молекулярной биофизики и интегрированного биоимиджинга в Национальной лаборатории Лоуренса Беркли в Калифорнии, вспоминает , что, когда он уточнил структуру бактериального белка GroEL в 1995году 2, расчет занял “много. Много часов. Если не дней”. Даже с БПФ и суперкомпьютером. “Пытаясь сделать это без БПФ. Я даже не знаю. Как бы мы это сделали реально- Это заняло бы целую вечность.”

Молекулярные каталогизаторы: биологические базы данных (1965)

Базы данных сегодня являются настолько органичным компонентом научных исследований. Что можно легко упустить из виду тот факт. Что они управляются программным обеспечением. За последние несколько десятилетий эти ресурсы увеличились в размерах и сформировали множество областей. Но, возможно. Нигде эта трансформация не была столь драматичной. Как в биологии.

Сегодняшние массивные базы данных генома и белков уходят своими корнями в работу Маргарет Дайхофф. Пионера биоинформатики в Национальном фонде биомедицинских исследований в Силвер-Спринг. Штат Мэриленд. В начале 1960-х годов. Когда биологи работали над разделением аминокислотных последовательностей белков. Дайхофф начал сопоставлять эту информацию в поисках ключей к эволюционным отношениям между различными видами. Ее Атлас последовательности и структуры белков, впервые опубликованная в 1965 году с тремя соавторами, описала то. Что было тогда известно о последовательностях. Структурах и сходствах 65 белков. Эта коллекция была первой. Которая “не была привязана к конкретному исследовательскому вопросу”. Писал историк Бруно Штрассер в 2010году 3. И он кодировал свои данные в перфокартах. Что позволяло расширять базу данных и искать ее.

Затем последовали другие компьютеризированные биологические базы данных. Банк данных о белках. Который сегодня содержит более 170 000 макромолекулярных структур. Начал функционировать в 1971 году. Рассел Дулитл. Биолог-эволюционист из Калифорнийского университета в Сан-Диего. Создал еще одну базу данных белков под названием Newat в 1981 году. А в 1982 году была выпущена база данных. Которая впоследствии стала GenBank-архивом ДНК. Хранящимся в Национальном институте здравоохранения США.

Модель молекулы банка данных белка

Банк белковых данных содержит архив из более чем 170 000 молекулярных структур. Включая бактериальный Кредит: Дэвид С. Гудселл и RCSB PDB (CC BY 4.0)

Такие ресурсы доказали свою ценность в июле 1983 года. Когда отдельные группы под руководством Майкла Уотерфилда. Биохимика белков из Имперского фонда исследований рака в Лондоне. И Дулитла независимо друг от друга сообщили о сходстве между последовательностями определенного фактора роста человека и белка в вирусе. Вызывающем рак у обезьян. Это наблюдение позволило предположить механизм вирусного онкогенеза. Заключающийся в том, что. Имитируя фактор роста. Вирус индуцирует неконтролируемый рост клеток.“Это выключило лампочку в некоторых умах биологов. Которые не занимались компьютерами и статистикой. — говорит Джеймс Остелл. Бывший директор Национального центра биотехнологической информации США (NCBI):” Мы можем понять что-то о раке из сравнения последовательностей.”

Кроме того, Остелл говорит. Что открытие ознаменовало “появление объективной биологии”. В дополнение к разработке экспериментов для проверки конкретных гипотез исследователи могли бы добывать общедоступные наборы данных для соединений. Которые, возможно. Никогда не приходили в голову тем. Кто действительно собирал данные. Эта сила резко возрастает. Когда различные наборы данных связаны друг с другом — чего программисты NCBI достигли в 1991 году с Entrez. Инструментом. Который позволяет исследователям свободно перемещаться от ДНК к белку к литературе и обратно.

Стивен Шерри. Нынешний исполняющий обязанности директора NCBI в Бетесде. Штат Мэриленд. Использовал Entrez в качестве аспиранта. “Помню. В то время я думал. Что это магия. — говорит он.

Прогноз лидер: общая модель обращения (1969)

В конце Второй мировой войны пионер вычислительной техники Джон фон Нейман начал превращать компьютеры. Которые несколькими годами ранее вычисляли баллистические траектории и конструкции оружия. В задачи прогнозирования погоды. До этого момента. Объясняет Манабе. “прогнозирование погоды было просто эмпирическим”. Используя опыт и интуицию. Чтобы предсказать. Что произойдет дальше. Команда фон Неймана, напротив. “пыталась сделать численное предсказание погоды. Основанное на законах физики”.

Уравнения были известны в течение десятилетий. Говорит Венкатрамани Баладжи. Руководитель отдела систем моделирования в Лаборатории геофизической гидродинамики Национального управления океанографии и атмосферы в Принстоне. Штат Нью-Джерси. Но ранние метеорологи практически не могли их решить. Для этого требовалось вводить текущие условия, вычислять. Как они будут меняться в течение короткого периода времени. И повторять — процесс настолько трудоемкий. Что математика не могла быть завершена до того. Как погода сама догонит. В 1922 году математик Льюис Фрай Ричардсон потратил месяцы. Хрустя шестичасовым прогнозом для Мюнхена, Германия. Результат, согласно одной истории. Был “дико неточным”. Включая предсказания. Которые “никогда не могли произойти ни при каких известных земных условиях”. Компьютеры сделали проблему сговорчивой.

Лучшие варианты для научного кода: 1872 респондента в опросе природы сказали, что Fortran complier повлиял на их работу.

В конце 1940-х годов фон Нейман создал свою группу по прогнозированию погоды в Институте перспективных исследований в Принстоне. В 1955 году вторая группа — Лаборатория геофизической гидродинамики — начала работу над тем. Что он назвал “бесконечным прогнозом”. То есть моделированием климата.

Манабе, который присоединился к команде по моделированию климата в 1958 году. Приступил к работе над атмосферными моделями; его коллега Кирк Брайан обратился к моделям океана. В 1969 году они успешно объединили их, создав то. Что Природа в 2006 году назвала “вехой” в научных вычислениях.

Современные модели могут разделить поверхность планеты на квадраты размером 25 × 25 километров. А атмосферу-на десятки уровней. В отличие от этого. Комбинированная модель 5 океана и атмосферы Манабе и Брайана использовала 500-километровые квадраты и 9 уровней и охватывала только одну шестую часть земного шара. Тем не менее. Говорит Баладжи. “эта модель проделала большую работу”. Позволив команде впервые проверить влияние повышения уровня углекислого газа в силико.

Номер cruncher: BLAS (1979)

Научные вычисления обычно включают в себя относительно простые математические операции с использованием векторов и матриц. Их просто очень много. Но в 1970-е годы не существовало общепризнанного набора вычислительных инструментов для выполнения таких операций. В результате программисты. Занимающиеся наукой. Тратят свое время на разработку эффективного кода для выполнения элементарных математических задач. Вместо того чтобы сосредоточиться на научных вопросах.

Мир программирования нуждался в стандарте. В 1979 году он получил один: Основные подпрограммы линейной алгебры, или BLAS6. Стандарт, который продолжал развиваться до 1990 года. Определил десятки фундаментальных процедур для векторной. А затем и матричной математики.

По сути, БЛАС свел матричную и векторную математику к базовым единицам вычислений. Таким же фундаментальным. Как сложение и вычитание. Говорит Джек Донгарра. Специалист по компьютерам из Университета Теннесси в Ноксвилле. Который был членом команды разработчиков БЛАСА.

Суперкомпьютер Cray-1 с сотрудниками Ливерморской национальной лаборатории имени Лоуренса в 1983 году

Суперкомпьютер Cray-1: до появления инструмента программирования BLAS в 1979 году не было стандарта линейной алгебры для исследователей. Работающих на таких машинах. Как суперкомпьютер Cray-1 в Национальной лаборатории Лоуренса Ливермора в Калифорнии.

По словам Роберта ван де Гейна (Robert van de Geijn). Специалиста по компьютерам из Техасского университета в Остине. BLAS был “вероятно. Наиболее последовательным интерфейсом для научных вычислений”. Помимо предоставления стандартных имен для общих функций. Исследователи могли быть уверены. Что код на основе BLAS будет работать одинаково на любом компьютере. Стандарт также позволил производителям компьютеров оптимизировать реализацию BLAS для быстрой работы на своем оборудовании.

Более 40 лет спустя BLAS представляет собой сердце научного вычислительного стека, кода. Который заставляет научное программное обеспечение работать. Лорена Барба. Инженер-механик и авиакосмический инженер в Университете Джорджа Вашингтона в Вашингтоне. Округ Колумбия. Называет это “машиной внутри пяти слоев кода”.

Говорит Донгарра: “Это обеспечивает ткань. На которой мы делаем вычисления.”

Микроскопия должна иметь: NIH Image (1987)

В начале 1980-х программист Уэйн Расбэнд работал с лабораторией нейровизуализации в Национальном институте здравоохранения США в Бетесде. Штат Мэриленд. У команды был сканер для оцифровки рентгеновских пленок. Но не было возможности показать или проанализировать их на своем компьютере. Поэтому Расбанд написал программу именно для этого.

Программа была специально разработана для миникомпьютера PDP-11 стоимостью 150 000 долларов США — стоечного. Явно не персонального компьютера. Затем, в 1987 году. Apple выпустила свой Macintosh II. Более дружелюбный и гораздо более доступный вариант. “Мне казалось очевидным. Что это будет работать намного лучше как своего рода лабораторная система анализа изображений”. — говорит Расбанд. Он перенес свое программное обеспечение на новую платформу и ребрендировал его. Создав экосистему анализа изображений.

NIH Image и его потомки дали исследователям возможность просматривать и количественно оценивать практически любое изображение на любом компьютере. Семейство программного обеспечения включает ImageJ, Java-версию, которую Расбанд написал для пользователей Windows и Linux, и Fiji, дистрибутив ImageJ, разработанный группой Павла Томанчака в Институте молекулярной клеточной биологии и генетики имени Макса Планка в Дрездене, Германия. Который включает в себя ключевые плагины. “ImageJ, безусловно. Является самым фундаментальным инструментом. Который у нас есть”. — говорит Бет Чимини. Вычислительный биолог. Работающий на платформе визуализации Broad Institute в Кембридже. Штат Массачусетс. “Я буквально никогда не разговаривал с биологом. Который использовал микроскоп. Но не ImageJ или его ответвление проект, Фиджи.”

Изображения четырех клеточных ядер под микроскопом

Инструмент ImageJ с помощью плагина может автоматически идентифицировать клеточные ядра на изображениях микроскопа. Как показано здесь.Кредит: Ignacio Arganda-Carreras/ImageJ

Отчасти это связано с тем. Что эти инструменты бесплатны. Говорит Расбанд. Но это также связано с тем. Что пользователям легко настроить инструмент в соответствии со своими потребностями. Говорит Кевин Элисейри. Биомедицинский инженер из Университета Висконсин–Мэдисон. Чья команда возглавила разработку ImageJ после ухода Расбанда на пенсию. ImageJ имеет обманчиво простой минималистский пользовательский интерфейс. Который практически не изменился с 1990 — х годов. Тем не менее. Инструмент является бесконечно расширяемым благодаря встроенному macro recorder (который позволяет пользователю сохранять рабочие процессы путем записи последовательностей щелчков мыши и выбора меню). Обширной совместимости форматов файлов и гибкой архитектуре плагинов. “Сотни людей” внесли плагины,-говорит Кертис Руден. Ведущий программист в группе Eliceiri. Эти дополнения значительно расширили набор инструментов для исследователей. С функциями отслеживания объектов во времени в видео или автоматической идентификации ячеек, например.

“Суть программы не в том. Чтобы быть всем и всем,-говорит Элисейри,-она должна служить цели своих пользователей. И в отличие от Photoshop и других программ. ImageJ может быть таким. Каким вы хотите его видеть.”

Sequence searcher: BLAST (1990)

Нет лучшего показателя культурной значимости. Чем превращение названия программы в глагол. Что касается поиска. Подумайте о Google. А что касается генетики. Подумайте о ВЗРЫВЕ.

Эволюционные изменения запечатлеваются в молекулярных последовательностях в виде замещений, делеций. Пробелов и перестроек. Ища сходства между последовательностями. Особенно между белками. Исследователи могут обнаружить эволюционные взаимосвязи и получить представление о функциях генов. Хитрость заключается в том. Чтобы сделать это быстро и всесторонне через быстро расширяющиеся базы данных молекулярной информации.

В 1978 году Дейхофф предоставил один важный фрагмент головоломки. Она разработала матрицу

В 1985 году Уильям Пирсон из Университета Вирджинии в Шарлотсвилле и Дэвид Липман из NCBI представили алгоритм FASTP. Сочетавший матрицу Дейхоффа с возможностью быстрого поиска.

Много лет спустя Липман вместе с Уорреном Гишем и Стивеном Альтшулом из NCBI. Уэббом Миллером из Университета штата Пенсильвания в Университетском парке и Джином Майерсом из Университета Аризоны в Тусоне разработали еще более мощное усовершенствование: Базовый инструмент поиска локального выравнивания (BLAST). Выпущенный в 1990 году. BLAST объединил скорость поиска. Необходимую для работы с быстрорастущими базами данных. С возможностью подбора совпадений. Которые были более эволюционно далеки. В то же время инструмент мог вычислить. Насколько вероятно. Что эти совпадения произошли случайно.

Результат был невероятно быстрым. Говорит Альтшул. — Вы можете начать поиск. Сделать один глоток кофе. И ваш поиск будет завершен.” Но что еще более важно. Он был прост в использовании. В эпоху, когда базы данных обновлялись по почте. Гиш создал систему электронной почты. А затем и веб-архитектуру. Которая позволяла пользователям выполнять поиск на компьютерах NCBI удаленно. Гарантируя таким образом. Что их результаты всегда будут актуальными.

По словам Шона Эдди. Компьютерного биолога из Гарвардского университета в Кембридже. Штат Массачусетс. Эта система дала тогдашней зарождающейся области геномной биологии трансформирующий инструмент-способ выяснить. Что могут делать неизвестные гены на основе генов. С которыми они связаны. А для секвенирующих лабораторий во всем мире это был умный неологизм: “Это просто одна из этих вещей. Которая стала глаголом”. — говорит Эдди. — Ты только что говорил о взрыве своих последовательностей.”

Препринт электростанции: arXiv.org (1991)

В конце 1980-х физики высоких энергий регулярно посылали физические копии своих рукописей коллегам по почте для комментариев и в качестве любезности — но только избранным. “Те. Кто стоял ниже в пищевой цепочке. Полагались на благосклонность тех. Кто был в списке А. И начинающие исследователи в неэлитных институтах часто полностью выходили из привилегированного круга”,-писал физик Пол Гинспарг в 2011году 7.

В 1991 году Гинспарг. Работавший тогда в Лос-Аламосской национальной лаборатории в Нью-Мексико. Написал автоответчик по электронной почте. Чтобы выровнять игровое поле. Подписчики ежедневно получали списки препринтов. Каждый из которых был связан с идентификатором статьи. С помощью одного электронного письма пользователи по всему миру могли отправить или получить статью из компьютерной системы лаборатории. Получить списки новых статей или выполнить поиск по автору или названию.

План Гинспарга состоял в том. Чтобы сохранить статьи в течение трех месяцев и ограничить содержание до сообщества физики высоких энергий. Но коллега убедил его оставить эти статьи у себя на неопределенный срок. “Это был момент. Когда он превратился из доски объявлений в архив”. — говорит он. И бумаги хлынули потоком из гораздо более далеких областей. Чем собственная дисциплина Гинспарга. В 1993 году Гинспарг перенес систему во Всемирную паутину. А в 1998 году дал ей название. Под которым она идет сегодня: arXiv.org.

Сейчас, в тридцатый год. ArXiv размещает около 1,8 миллиона препринтов — все они доступны бесплатно — и привлекает более 15 000 представлений и около 30 миллионов загрузок в месяц. “Нетрудно понять. Почему arXiv является такой популярной услугой. — писали редакторы Nature Photonics 8 десять лет назад по случаю двадцатилетия сайта:” Система предоставляет исследователям быстрый и удобный способ установить флаг. Который показывает. Что они делали и когда. Избегая хлопот и времени. Необходимого для рецензирования в обычном журнале.”

гистограмма, показывающая резкий рост представлений arXiv с 1991 года

Источник: arXiv.org

Успех сайта катализировал бум сестринских архивов в биологии, медицине. Социологии и других дисциплинах. Влияние можно увидеть сегодня в десятках тысяч препринтов. Которые были опубликованы на вирусе SARS-CoV-2.

“Отрадно видеть. Что методология. Считавшаяся неортодоксальной за пределами сообщества физики элементарных частиц 30 лет назад. Теперь более широко рассматривается как очевидная и естественная”,-говорит Гинспарг. — В этом смысле это похоже на успешный исследовательский проект.”

Проводник данных: IPython Notebook (2011)

Фернандо Перес был аспирантом “в поисках прокрастинации” в 2001 году. Когда он решил взять на себя основной компонент Python.

Python-это интерпретируемый язык. Который означает. Что программы выполняются построчно. Программисты могут использовать своего рода вычислительный инструмент вызова и ответа. Называемый циклом чтения-оценки-печати (REPL). В котором они набирают код. А программа. Называемая интерпретатором. Выполняет его. REPL позволяет быстро исследовать и повторять. Но Перес отметил. Что Python не был создан для науки. Например, он не позволял пользователям легко загружать модули кода или сохранять открытыми визуализации данных. Поэтому Перес написал свою версию.

Результатом стал IPython. Десять лет спустя физик Брайан Грейнджер. Работая с Пересом и другими. Перенес этот инструмент в веб-браузер. Запустив ноутбук IPython и положив начало революции в науке о данных.

Как и другие вычислительные ноутбуки, IPython Notebook объединил код, результаты. Графику и текст в одном документе. Но в отличие от других подобных проектов. IPython Notebook был открытым исходным кодом. Приглашая вклад огромного сообщества разработчиков. И он поддерживал Python. Популярный язык для ученых. В 2014 году IPython превратился в Project Jupyter. Поддерживающий около 100 языков и позволяющий пользователям изучать данные на удаленных суперкомпьютерах так же легко. Как и на собственных ноутбуках.

“Для специалистов по обработке данных Jupyter стал стандартом де — факто”, — писала Nature в 2018году 9. В то время на платформе кодшеринга GitHub было 2,5 миллиона записных книжек Jupyter; сегодня их насчитывается почти 10 миллионов, включая те. Которые документируют открытие гравитационных волн в 2016 году и визуализацию черной дыры в 2019 году. “То. Что мы внесли небольшой вклад в эти проекты. Чрезвычайно полезно”. — говорит Перес.

Быстрый ученик: AlexNet (2012)

Искусственный интеллект (ИИ) поставляется в двух вариантах. Один использует кодифицированные правила. Другой позволяет компьютеру На протяжении десятилетий. Говорит Джеффри Хинтон. Компьютерный ученый из Университета Торонто, Канада. Исследователи ИИ отвергали последний подход как “нонсенс”. В 2012 году аспиранты Хинтона Алексей Крижевский и Илья Суцкевер доказали обратное.

Местом проведения был ImageNet. Ежегодный конкурс. Который ставит перед исследователями задачу обучить ИИ на базе данных из миллиона изображений повседневных объектов. А затем протестировать полученный алгоритм на отдельном наборе изображений. В то время лучшие алгоритмы неправильно классифицировали около четверти из них. Говорит Хинтон. AlexNet Крижевского и Суцкевера. Алгоритм 10. “Мы в основном вдвое сократили частоту ошибок или почти вдвое”. — отмечает Хинтон.

Хинтон говорит. Что успех команды в 2012 году отразил сочетание достаточно большого набора обучающих данных. Великолепного программирования и недавно появившейся мощи графических процессоров-процессоров. Изначально предназначенных для ускорения работы компьютерного видео. “Внезапно мы могли бы запустить [алгоритм] в 30 раз быстрее. — говорит он. — или изучить в 30 раз больше данных.”

Настоящий алгоритмический прорыв. По словам Хинтона. На самом деле произошел три года назад. Когда его лаборатория создала нейронную сеть. Которая могла распознавать речь более точно. Чем обычные ИИ. Которые были усовершенствованы в течение десятилетий. “Это было только немного лучше- Но это уже было написано на стене.”

Эти победы возвестили подъем глубокого обучения в лаборатории. Клинике и многое другое. Вот почему мобильные телефоны способны понимать разговорные запросы и почему инструменты анализа изображений могут легко выделить ячейки в фотомикрографах. И именно поэтому AlexNet занимает свое место среди многих инструментов. Которые коренным образом изменили науку. А вместе с ними и мир.

Природа 589, 344-348 (2021)

Обновления и исправления

  • Исправление 22 января 2021года : Более ранняя версия этой функции ошибочно утверждала. Что Пол Гинспарг перенес раннюю версию системы обмена препринтами arXiv в Интернет.

  • Обновление от 19 февраля 2021 года: Эта статья была обновлена данными опроса. В котором читателям предлагалось взвесить коды. Выбранные в этой функции (см.

  • Исправление 08 апреля 2021года : Более ранняя версия этой истории ошиблась в описании команды разработчиков ноутбуков IPython и размера первой выпущенной версии.

Рекомендации

  1. 1.

    The Event Horizon Telescope Collaboration et al. Astrophys. J. Lett. 875, L1 (2019).

  2. 2.

    Braig, K., Adams. P. D. & Brünger. A. T. Nature Struct. Биол. 2, 1083–1094 (1995).

  3. 3.

    Штрассер, Би-Джей-Джей Хист. Биол. 43, 623–660 (2010).

  4. 4.

    Newmark, P. Nature 304, 108 (1983).

  5. 5.

    Manabe, S. & Bryan, K. J. Атмосфера. Sci. 26, 786-789 (1969).

  6. 6.

    Lawson, C. L., Hanson. R. J., Kincaid. D. R. & Krogh. F. T. ACM Trans. Математика. Программное обеспечение 5, 308-323 (1979).

  7. 7.

    Гинспарг, П. Препринт на сайте http://arxiv.org/abs/1108.2700 (2011).

  8. 8.

    Природа Фотона. 6, 1 (2012).

  9. 9.

    Природа 563, 145-146 (2018).

  10. 10.

    Krizhevsky, A., Sutskever. I. & Hinton. G. E. in Proc. 25-е Инт. Конф. Нейронные системы обработки информации (eds Pereira, F., Burges. C. J. C., Bottou. L. & Weinberger. K. O.) 1097-1105 (Curran Associates, 2012).

Скачать ссылки

Последние новости:

Инструктаж по природе

Важный раунд научных новостей. Мнений и анализа. Доставляемых в ваш почтовый ящик каждый будний день.

Статьи по теме

Предметы