Nagroda ERCIM Cor Baayen Award przyznawana jest corocznie obiecującym młodym naukowcom prowadzącym badania w zakresie informatyki i matematyki stosowanej. Laureatem za rok 2021 został kandydat zgłoszony przez Wydział Matematyki, Informatyki i Mechaniki UW – dr Tomasz Kociumaka z Uniwersytetu Kalifornijskiego w Berkeley, który przez lata związany był z Uniwersytetem Warszawskim.

Dr Tomasz Kociumaka pracuje obecnie na Uniwersytecie Kalifornijskim w Berkeley. Przez lata związany był z Uniwersytetem Warszawskim, gdzie jako student Wydziału Matematyki, Informatyki i Mechaniki reprezentował UW m.in. w Akademickich Mistrzostwach Świata w Programowaniu Zespołowym. W 2019 roku obronił doktorat na WMIM UW. Jego praca doktorska została wyróżniona Nagrodą Prezesa Rady Ministrów RP. W 2018 roku dr Kociumaka otrzymał Nagrodę im. Witolda Lipskiego dla młodych naukowców w zakresie informatyki. Jego dorobek publikacyjny obejmuje ponad 50 artykułów naukowych. Referaty dr. Kociumaki były nagradzane na konferencjach CPM 2016, LATA 2018 i SPIRE 2018. Według Google Scholar, h-index badacza wynosi 23, a jego prace uzyskały ponad 1400 cytowań (marzec 2022).

 

Kandydaturę dr. Tomasza Kociumaki do Nagrody im. Cora Baayena zgłosił prof. Łukasz Kowalik, dyrektor Instytutu Informatyki UW. Laureata doceniono m.in. za jego wkład w badania nad algorytmiką tekstów. 

 

Algorytmy i genomy

Dr Tomasz Kociumaka zajmuje się algorytmami tekstowymi, czyli opracowywaniem efektywnych metod przechowywania i przetwarzania danych w formie tekstowej. Projektowane przez niego algorytmy operują na tekstach rozumianych jako abstrakcyjne ciągi znaków. – W zastosowaniach mogą to być np. teksty w języku naturalnym, kody programów komputerowych, rejestry zdarzeń czy też sekwencje biologiczne. Szczególnie te ostatnie, ze względu na ogromną liczbę sekwencjonowanych obecnie genomów, wymagają wykorzystywania najnowszych osiągnięć algorytmiki tekstów – tłumaczy dr Kociumaka.

 

Do najważniejszych wyników jego badań, które prowadził wraz ze współpracownikami w ciągu ostatnich kilku lat, należą:

  • opracowanie algorytmów wyszukiwania przybliżonych wystąpień wzorca, czyli fragmentów tekstu, które, z dokładnością do edycji niewielkiej liczby znaków, pasują do wskazanego wzorca;
  • efektywna metoda konstrukcji transformaty Burrowsa-Wheelera – kluczowego narzędzia bezstratnej kompresji danych, wykorzystywanego m.in. w popularnym formacie bzip2;

  • ustrukturyzowanie danych do efektywnego wyznaczania najdłuższego wspólnego prefiksu dwóch dowolnych fragmentów przechowywanego tekstu, przedstawiona najpierw w wersji z teoretycznymi gwarancjami optymalności, a później w formie implementacji dostosowanej do charakterystyki rzeczywistych tekstów.