Комитет по номенклатуре генов (HUGO Gene Nomenclature Committee, HGNC) принял новые правила именования для человеческих генов. Все из-за программы для ведения электронных таблиц Excel, которая ошибочно принимает этот тип данных за даты.
Геном человека содержит десятки тысяч генов — каждому присваивается уникальное имя и буквенно-цифровой код, который ученые используют в своих работах. Однако за последний год генетикам пришлось переименовать 27 генов из-за того, что инструмент Microsoft неправильно интерпретирует эти символы в качестве даты.
Некоторые из переименованных генов были похожи на названия месяцев. Например, записанный в ячейку "MARCH1" (сокр. от Membrane Associated Ring-CH-Type Finger 1) автоматически преобразовывался в дату — "1-Mar" (1 марта).
Причем такое явление очень распространено. Согласно исследованию, проведенному в 2016 году, ошибкой в Excel оказалась затронута почти каждая пятая из 3597 работ, опубликованных в рецензируемых научных журналах.
Исправить ошибочное поведение программы не так-то легко. Прежде всего, пишет The Verge, Excel вообще не позволяет отключить функцию автоматического форматирования. И даже если ученый вручную выставит корректный тип данных в отдельных столбцах, нет никаких гарантий, что та же таблица, открытая у его коллеги, не вызовет ошибку.
При этом отказаться от Excel генетики не могут — они повсеместно используют этот инструмент в своей работе, в том числе при проведении клинических испытаний.
В соответствии с новыми правилами, MARCH1 был переименован в MARCHF1, а SEPT1 стал SEPTIN1. Запись старых названий и символов будет храниться в базе HGNC, чтобы избежать путаницы в будущем.