OpenAI ogłosiło opracowanie dużego modelu językowego o nazwie GPT-Rosalind, specjalnie przeszkolonego w zakresie typowych przepływów pracy w biologii. Model, nazwany na cześć biolog Rosalind Franklin, reprezentuje wyspecjalizowane podejście do analizy danych biologicznych, odróżniając go od bardziej ogólnych modeli zwykle stosowanych przez duże firmy technologiczne.
Yunyun Wang, kierownik produktu OpenAI dla nauk przyrodniczych, stwierdził, że GPT-Rosalind usuwa istotne przeszkody w badaniach biologicznych. Pierwsze wyzwanie wynika z ogromnych zbiorów danych powstałych w wyniku dziesięcioleci sekwencjonowania genomu i biochemii białek. Drugie wyzwanie polega na specjalizacji wielu dziedzin biologii, z których każda charakteryzuje się unikalnymi technikami i specyficznym żargonem.
Na przykład genetycy mogą napotkać trudności w poruszaniu się po obszernej literaturze neurobiologicznej dotyczącej określonych genów aktywnych w komórkach mózgowych. Wang zauważył, że OpenAI przeszkoliło GPT-Rosalind w zakresie 50 najpopularniejszych biologicznych procesów roboczych i dostępu do głównych publicznych baz danych zawierających informacje biologiczne.
Model jest przygotowany do sugerowania potencjalnych szlaków biologicznych i ustalania priorytetów celów leku. „Łączymy genotyp z fenotypem poprzez znane ścieżki i mechanizmy regulacyjne, wnioskując o prawdopodobnych właściwościach strukturalnych lub funkcjonalnych białek i naprawdę wykorzystując to mechanistyczne zrozumienie” – powiedział Wang.








