Strona w budowie, zapraszamy wkrótce...

Zapraszamy już za:

-647Dni -16Godzin -26Minut -35Sekund

 

 

Strona w budowie, zapraszamy wkrótce...

Xiaomi stworzyło specjalne rozwiązanie, aby pomóc osobom z zaburzeniami mowy

Mariusz Laurisz
Mariusz Laurisz
Z branżą nowych technologii związany od ponad dwóch dekad. Od czterech lat Redaktor Naczelny oraz Wydawca magazynu IT Reseller Polska.

Powiązane

Xiaomi zaprezentowało najnowsze zastosowanie zaawansowanych algorytmów sztucznej inteligencji w samodzielnie opracowanej technologii syntezy mowy. Technologia Text-To-Speech, opracowana przez Xiaomi AI Lab, jest używana do generowania unikalnego brzmienia głosu dla osób z zaburzeniami mowy.

Dzięki temu, osoby z zaburzeniami mowy mogą komunikować się za pomocą indywidualnego „własnego głosu”, zamiast syntezowanych elektronicznie, monotonnych dźwięków. To efekt prac, będących częścią projektu badawczego „Own My Voice” prowadzonego przez Komitet Techniczny Xiaomi, który jest doskonałym przykładem zaangażowania firmy w tworzenie i rozwijanie innowacji, które mogą poprawić komfort życia.

 

Dlaczego Xiaomi uruchomiło ten projekt?

Nawiązując do pragnienia wielu osób z zaburzeniami mowy, aby posiadać własne, niepowtarzalne brzmienie i charakter głosu w codziennej komunikacji, firma powołała zespół projektowy „Own My Voice”.

 

„Jesteśmy podekscytowani możliwością zbadania wielu obszarów i wartości, jakie niosą ze sobą innowacje technologiczne, takich jak np. odpowiadanie na potrzeby użytkowników w zakresie samoidentyfikacji i w budowie tożsamości”. – powiedział Zhu Xi, koordynator projektu Tech for Good w Komitecie Technicznym Xiaomi.

 

Sposób realizacji

Aby stworzyć możliwie najbardziej spersonalizowane głosy dla osób z zaburzeniami mowy, zespół Xiaomi zaangażował w projekt ponad 200 ochotników, których próbki mowy zarejestrowano i przeanalizowano na potrzeby projektu. Następnie wykorzystano specjalne algorytmy, które dopasowaly nagrane  do mowy użytkownika. Dzięki temu udało się ustalić najbardziej odpowiednie brzmienie jako głos referencyjny dla danej osoby z zaburzeniami mowy. Mając na uwadze ochronę prywatności, wybrane rzeczywiste głosy zostały poddane złożonej modyfikacji akustycznej, aby uzyskać nowe, oryginalne brzmienie.

Następnie użyto technologii spontanicznej konwersji tekstu na mowę (Text-To-Speech) do wytrenowania modelu sztucznej inteligencji. Wszystko po to, by nowy głos nabrał naturalnego rytmu i intonacji, co pozwala wiernie wyrazić emocje i ton mowy człowieka.

W projekcie „Own My Voice” połączono wiele zaawansowanych algorytmów z opracowaną przez Xiaomi nową technologią syntezy mowy, aby zapewnić unikalność, bezpieczeństwo i autentyczność generowanego głosu.

 

Znaczenie i waga projektu

Trzonem tego projektu jest grupa ekspertów w dziedzinie technologii mowy z Xiaomi AI Lab. Od 2017 roku opublikowali oni 37 prac na temat mowy, wygłoszonych podczas wielu międzynarodowych konferencji, takich jak International Conference on Acoustics, Speech, and Signal Processing (ICASSP). Sukces aplikacji „Own My Voice” zależy od opracowanej przez nich unikalnej technologii Text-To-Speech.

Technologia zamiany tekstu na mowę metodą spontaniczną upodabnia syntezowany głos do prawdziwej ludzkiej mowy w zakresie intonacji, pauz, szybkości i innych cech. Zastępuje to monotonne i nienaturalne brzmienie głosu elektronicznego. Technologia ta jest już stosowana w wielu inteligentnych urządzeniach Xiaomi wyposażonych w funkcję asystenta głosowego. Projekt „Own My Voice” pokazuje, że synteza mowy Text-To-Speech może być również szeroko stosowana w przełamywaniu barier niepełnosprawności i poprawie komfortu życia.

 

„Jeżeli zauważymy i uwzględnimy tego typu potrzeby na wczesnym etapie, proces upowszechniania innowacji można znacznie skrócić, a korzyści, które z nich płyną, mogą być szybciej dostępne dla potrzebujących tego osób” – wyjaśnia Zhu Xi.

HP opublikowało najnowszy raport HP Wolf Security Threat Insights, analizujący rzeczywiste ataki cybernetyczne.

ZOSTAW ODPOWIEDŹ

Please enter your comment!
Please enter your name here

Newsletter

Social media

Najpopularniejsze

Feardemic rozbudowuje portfolio gier, liczy na poszerzenie grona odbiorców.

Feardemic - spółka-córka Bloober Team i wydawca gier z gatunku horror - poszerza swoje portfolio wydawnicze, aby trafić do większej grupy odbiorców, poinformował CEO...

Warszawski Instytut Bankowości/Związek Banków Polskich: 86% Polaków czuje się bezpiecznie, korzystając...

Liderem w obszarze cyberbezpieczeństwa są banki (54%), wyprzedzając tym samym firmy technologiczne (31%) oraz wojsko i policję (30%), wynika z badania "Postawy Polaków wobec...

Rząd planuje powołanie Centralnego Biura Zwalczania Cyberprzestępczości.

Rząd planuje powołanie Centralnego Biura Zwalczania Cyberprzestępczości, które ma zajmować się wyłącznie problemami dotyczącymi cyberbezpieczeństwa, poinformował premier Mateusz Morawiecki. Planowane są zmiany ustawy o...

Biuro Informacji Kredytowej: Wartość pożyczek od firm pożyczkowych wzrosła o 119,9%...

Firmy pożyczkowe udzieliły w czerwcu finansowania na kwotę 661 mln zł (wzrost o 119,9% r/r), wynika z danych Biura Informacji Kredytowej (BIK). Średnia wartość...

Huawei podczas International Automobile Industry Exhibition w Szanghaju ogłosił rozpoczęcie sprzedaży...

Huawei rusza ze sprzedażą na chińskim rynku pierwszego samochodu z technologią Huawei na pokładzie. Od środy 21 kwietnia, elektryczny samochód SERES SF5 będzie dostępny...

Najnowsze

Chińskie firmy zapewniają, że powstrzymają spekulacyjny handel NFT.

Chińscy giganci technologiczni, w tym Tencent Holdings i Ant Group, podpisali pakt mający na celu powstrzymanie wtórnego handlu cyfrowymi przedmiotami kolekcjonerskimi i „samoregulację” tego...

Unia Europejska przedłużyła europejskie zasady raomingu do 2032 roku.

Ilekroć przychodzi mi opuścić teren UE, przypominam sobie jak dobrze funkcjonuje europejski roaming. Ten, na szczęście, przedłużono do 2032 roku.  Jak podała Komisja Europejska,przepisy „roam-like-at-home”...

Samsung prawdopodobnie wprowadzi wyraźnie tańszy niż dotychczasowe model składanego telefonu.

Składane smartfony są już z nami od kilku lat, ale pozostają urządzeniami bardzo kosztownymi. Samsung najwyraźniej chce to zmienić.  Jak donoszą media z Korei Południowej,...

W układach graficznych AMD Radeon RX 7000 prawdopodobnie znajdziemy wyspecjalizowane rdzenie...

Następna generacja kart graficznych AMD Radeon jest obecnie w trakcie rozwoju, a wiele wskazuje na to, że AMD szykuje w niej wyspecjalizowane rdzenie służące...

Bezpieczeństwo danych w systemach pamięci masowych IBM.

Rok 2022 przyniósł wielu firmom i przedsiębiorstwom nowe wyzwania. Zmagają się one nie tylko z szalejącymi cenami czy przerwaniem łańcuchów dostaw, ale pojawiły i...