Actualment, podem trobar molts programes de transcripció automàtica. Ens prometen transcripcions llestes en qüestió de minuts i, fins i tot, capaces d’identificar els diferents interlocutors.

Els professionals de la transcripció ja et podem avançar que això no és del tot cert.

A continuació, t’indico a grans trets en quins casos obtindràs un resultat molt bo amb la transcripció automàtica i en quins no.

 

Quan utilitzar la transcripció automàtica

Abans de res, et donaré uns consells perquè identifiquis ràpidament si és el tipus de transcripció que necessites:

  • El primer i més IMPORTANT: normalment la transcripció automàtica es fa servir en la transcripció natural, no en la transcripció literal.
  • És molt útil en arxius d’àudio d’un interlocutor, amb un accent comú (no gaire marcat) i una velocitat de parla “normal”, sense soroll de fons i amb bona qualitat de so. El resultat en aquests casos és molt bo.
  • Si hi ha 2 o més interlocutors, la cosa es complica… Te’n poso un exemple ràpid: en entrevistes en què la persona entrevistada i la persona entrevistadora respecten els torns de parla, normalment no hi ha gaires problemes. En aquests casos, els errors solen donar-se en la diferenciació d’interlocutors. Hauràs d’anar amb molt de compte en separar els segments de text per diferenciar-los.

En tot cas, és important que sàpigues que sempre caldrà comprovar i corregir tot el text que t’hagi proporcionat l’aplicació, comparant-lo amb l’àudio original. Si vols que t’expliquem quines són les millors aplicacions per transformar àudio en text de manera automàtica, visita aquest blog.

Quan es necessita la transcripció humana

Com a l’apartat anterior, et deixo uns consells per decidir si necessites una transcripció humana, també anomenada transcripció manual:

  • IMPORTANT: en la majoria dels casos en què calgui fer una transcripció literal, hauràs de triar aquesta opció.
  • Si l’àudio no és de bona qualitat, hi ha soroll de fons o la persona que parla té un accent peculiar, l’hauràs de transcriure manualment.
  • En enregistraments amb 2 o més interlocutors que mantinguin una conversa natural, gairebé segur que necessitaràs una transcripció humana, ja que solen trepitjar-se quan parlen. Als motors de transcripció automàtica els costa identificar les veus i barregen el text.
  • Pel que fa als enregistraments que s’han de presentar en judicis, la majoria consten de diversos interlocutors, són converses naturals i estan gravats amb dispositius amateurs o mòbils i de baixa qualitat.

De vegades, pot ser més convenient optar per una transcripció híbrida. És a dir, utilitzar un programa de transcripció automàtica per transcriure els teus vídeos o àudios en català, i fer una transcripció manual dels segments més deteriorats. Aquest procediment et pot servir si estem parlant de grans volums de transcripció.

Si tens algun dubte o no tens temps de fer les transcripcions personalment i necessites un servei de transcripció professional, escriu-nos sense cap compromís.