Office a genetyka: HGNC zmienia nazewnictwo, bo Excel zniekształcał wyniki

Strona główna Aktualności
HGNC zmienia nazewnictwo, bo Excel zniekształcał wyniki (tło: Pixabay)
HGNC zmienia nazewnictwo, bo Excel zniekształcał wyniki (tło: Pixabay)

O autorze

Komitet Nazewnictwa Genów Międzynarodowej Organizacji Badań nad Ludzkim Genomem zdecydował się zmienić nazwy szeregu substancji i procesów, ponieważ Microsoft Excel zastępował je innymi skutek automatycznej konwersji. Niektóre symbole były błędnie rozpoznawane jako miesiące, zmieniając nierzadko formatowanie kolumn w arkuszach z wynikami badań.

Masowe błędy

Jak skondlukowano w pewnym badaniu z 2016 roku (Ziemann, Yotam Eren, El-Osta), około 20 proc. wszystkich materiałów naukowych publikowanych przez genetyków zawiera błędy wynikające z automatycznej konwersji nazw, jakiej dokonuje Excel. Na przykład septyna, często oznaczana jako SEPT1, bywa rozumiana przez Excela jako data, w konsekwencji czego na wykresach i arkuszach widnieje nie pod swoją nazwą, a jako "01 wrz. 2020" i podobne. Zbliżony los spotyka sekwencje cDNA opisywane według konwencji ośrodka RIKEN. Excel uznaje ich zapis za notację wykładniczą, przez co zmienia typy serii danych.

Ponieważ łatwiej jest odgórnie zmienić nazewnictwo w całej dziedzinie naukowej niż przeszkolić wszystkich genetyków z obsługi Excela, HGNC zdecydowało się, o czym możemy przeczytać w Nature, zmienić nomenklaturę tak, aby uniknąć automatycznej konwersji komórek. Septyna nie będzie się już nazywać SEPT1, a SEPTIN1, dzięki czemu nigdy nie stanie się pierwszym września. Zmian jest więcej i dotyczą wielu niemających ze sobą wiele wspólnego kwestii.

Problem do uniknięcia

Dzięki nieprzejednaniu Excela, obowiązującą konwencją/praktyką w genetyce mają być też nowe nazwy dla symboli syntetazy tRNA. Nie są to zmiany rewolucyjne, a część z nich była wprowadzana po cichu już wcześniej. Poprzednie nie stają się też "błędne" lub wadliwe.

Dla porządku należy wspomnieć, że Excel umożliwia wyłączenie automatycznej konwersji poprzez odgórne ustalenie formatowania dla komórek. Gdy jawnie określimy treść komórki jako "tekst", Excel nie będzie próbował zgadywać typu danych w niej. Należy w tym celu zaznaczyć odpowiedni obszar i wybrać "Formatuj komórki..." z menu kontekstowego lub przycisku "Formatuj" sekcji "Komórki" na wstążce "Narzędzia główne".

© dobreprogramy
s