Den 13-06-2013 02:17, Jesper Lund skrev:
> Nå. Jeg fandt nu indlægget meget nyttigt.
Tak - hvis man ikke er interesseret, kan man jo bare undlade at læse
mine indlæg. Overskriften (emnet) siger jo hvad indlægget handler om.
Hvis man som jeg, ønsker at "hardsubbe" en video, viser søgning på
nettet, at en masse mennesker har problemer med dette.
Det er nemt nok at downloade et forkromet Windows-program, der klarer
opgaven - måske til UG, det ved jeg ikke, for jeg benytter ikke Windows.
Jeg bruger Ubuntu-linux Server, og har derfor ingen GUI, men benytter
terminalen og kommandoline, CLI.
Som beskrevet tidligere, er det lykkedes at rippe VobSub undertekster,
og få et rimeligt resultat. Dog ikke perfekt.
Først når VobSub som er billeder, omsættes til tekst, bliver resultatet
perfekt.
Denne opgave klares af "VobSub2Srt", som grundlæggende benytter
Tesseract-ocr.
Nu er der dog bare et mindre problem tilbage at løse:
Den danske language-fil, som Tesseract benytter, mangler de store Æ, Ø og Å.
Små æ, ø og å fungerer fint, men hvis et ord i underteksten begynder med
Æ, Ø eller Å, vises et "?".
Jeg tror dog sagtens problemet kan løses - og gør problemer ikke bare
tilværelsen mere spændende? :-)
Når man løser problemer, får man også et mere indgående kendskab til
programmerne. Det hjælper ikke meget at læne sig tilbage, og forbande
programmøren ad helvede til.