Softcatalà ha presentat oficialment el nou servei de transcripció d’àudio i vídeo a text, després d’unes setmanes en proves. Es tracta d’una eina que serveix per transcriure gravacions, apunts o pòdcasts a text, així com per a crear subtítols per a vídeos, entre d’altres.
“Amb aquest nou servei serà més senzill transcriure els arxius en català d’àudio i vídeo a text, sense necessitat d’eines en altres idiomes”, destaca l’associació sense ànim de lucre, que treballa per la normalització de la llengua catalana en l’àmbit digital i tecnològic.
Funcionament
Per utilitzar el servei de transcripció cal enviar al web un fitxer d’àudio o vídeo en format MP3, WAV, OGG, FLAC, AVI, MP4, MOV o MKV. Un cop processat, s’enviarà un correu electrònic amb l’enllaç de la transcripció. El fitxer s’esborrà 72 hores després de ser transcrit.
Un cop rebut el correu, es pot escollir entre descarregar la transcripció en format text o en SubRip (str), que és el més popular en subtítols. A més de baixar els textos, també hi ha l’opció d’un editor en línia que permet corregir la transcripció, ja que aquests serveis cometen errades.
Softcatalà utilitza models de transcripció d’OpenAI anomenats Whisper per oferir el nou servei. En aquest sentit, l’entitat té un projecte focalitzat en millorar-los per al català.