Firma Microsoft uruchomiła „MAI-Transcribe-1”, model transkrypcji oparty na sztucznej inteligencji, który zapewnia dokładność zamiany mowy na tekst w 25 powszechnie używanych językach. Model ma służyć do takich zastosowań, jak spotkania, napisy kodowane i dyktando.
MAI-Transcribe-1 zostanie udostępniony w Microsoft Foundry wraz z innymi modelami MAI-Voice-1 i MAI-Image-2. Microsoft stwierdził, że dzięki temu wprowadzeniu na rynek „modele MAI staną się po raz pierwszy szeroko dostępne do użytku komercyjnego”, umożliwiając klientom ocenę i tworzenie aplikacji wykorzystujących sztuczną inteligencję w transkrypcji, generowaniu głosu i obrazów.
MAI-Voice-1 oferuje hiperrealistyczną generację mowy, która zachowuje tożsamość mówiącego i niuanse emocjonalne w całej rozszerzonej treści. Zawiera funkcję podpowiedzi głosowych, która umożliwia tworzenie niestandardowych głosów marki na podstawie zaledwie jednej minuty nagranego dźwięku.
Tymczasem MAI-Image-2 to nowy model generowania tekstu na obraz, który wyróżnia się renderowaniem naturalnego oświetlenia, dokładnymi odcieniami skóry i wyraźnym tekstem na obrazach. Model ten znalazł się w pierwszej trójce rankingów konwersji tekstu na obraz Arena.ai.
Microsoft w dalszym ciągu zmniejsza swoją zależność od technologii OpenAI. Firma skrytykowała GPT-4 za wysokie koszty i długi czas reakcji. W związku z tym Microsoft zainicjował rozwój własnych, wewnętrznych modeli sztucznej inteligencji i ocenia modele innych firm pod kątem funkcji Copilot.
Mustafa Suleyman, dyrektor generalny AI firmy Microsoft, potwierdził skupienie się na opracowywaniu „nieprzygranicznych” modeli sztucznej inteligencji, zauważając, że nie osiągną one poziomu zaawansowania oferty OpenAI. Niedawna restrukturyzacja kierownictwa Copilot firmy Microsoft zaowocowała utworzeniem czterech działów: doświadczenie Copilot, platforma Copilot, aplikacje Microsoft 365 i modele AI. Jacob Andreou, były dyrektor Snap, będzie kierował działem doświadczeń Copilot i raportował do dyrektora generalnego Microsoft, Satyi Nadelli.
Dyrektor generalny Salesforce, Marc Benioff, stwierdził wcześniej, że Microsoft prawdopodobnie przestanie korzystać z technologii OpenAI, wskazując na wyzwania stojące przed OpenAI, w tym rezygnację z wartego 500 miliardów dolarów projektu Stargate, mającego na celu budowę centrów danych w całych Stanach Zjednoczonych.








