Activity
From 26.05.2016 to 24.06.2016
23.06.2016
- 16:03 Task #3803: OCR - jazykový model v Tesseractu
- Oficiální popis tréninku LM zde:
https://github.com/tesseract-ocr/tesseract/wiki/tesstrain.sh
Není mi z toho jas... - 15:17 Task #3803: OCR - jazykový model v Tesseractu
- Před jazkyovým modelel bude třeba také asi natrénovat na font "psací stroj". Návod by mohl být zde: http://www.joyofd...
- 15:06 Task #3875: Zjistit jak dostat z Tesseractu lattices pro další zpracování/rescoring
- Napojení na API + testovací prográmek hotov. Lze vypsat pro každý grafém jeho varianty s confidence. Otázka je, jestl...
- 11:43 Task #3875: Zjistit jak dostat z Tesseractu lattices pro další zpracování/rescoring
- Prozatím mám způsob jak dostat lattices s grafémy. Je třeba se napojit na API a trochu programování v C++, ale je to ...
22.06.2016
- 13:02 Task #3950 (Closed): Vygenerovat validacnu sadu pre OCR
- 12:19 Task #3950 (Resolved): Vygenerovat validacnu sadu pre OCR
- Vybráno a připraveno 5 souborů včetně přepisů. různá kvalita OCR (některé skoro celé OK, jiné naprosto hrozné).
+...
21.06.2016
- 17:27 Task #3940 (Closed): Nelinearna difuzia pre OCR
- 14:39 Task #3951 (Assigned): Testovanie nelinearnej difusie na validacnych dokumentoch
- 14:38 Task #3951 (Closed): Testovanie nelinearnej difusie na validacnych dokumentoch
- Pre siroku skalu parametrov nelinearnej difusie spustit OCR na sade anotovanych obrazkov, ktore vznikli v #3950.
- 14:33 Task #3950 (Closed): Vygenerovat validacnu sadu pre OCR
- Pripravit minimalne 3 obrazky roznej kvality (bad/mediocre/good).
Prepisat dokumenty pre ucely automatickeho vyhodno...
20.06.2016
- 06:47 Task #3940 (Resolved): Nelinearna difuzia pre OCR
- Zjištění ohledně nelineární difuze:
- Parametry jsou opravdu hodně citlivé. Změnou o jednotku se můžou části text...
07.06.2016
- 15:22 Administration, support #3776 (Closed): Předání dat - ochrana osobních údajů
- Data mohou být v rámci akademického zporacování předána nám pouze s smlouvou o předání dat (bez posvěcení ÚOOÚ).
- 15:21 Administration, support #3800 (Closed): GUI - odpovědný pracovník
- 15:19 Administration, support #3800 (Resolved): GUI - odpovědný pracovník
- Petr Stanislav upravý SW z jiných prostředků (stipendium újč) - postupně bude práci (pokud půjde i stipendiu = další ...
- 15:20 Task #3799 (Closed): test ASR
- 15:16 Task #3931: Test ASR
- Pepa slíbil, že kontaktuje studenta, zda je schopný přepisy učesat do konce července, aby jsme nečekali nakonec až do...
- 10:22 Task #3818 (Closed): Testovanie metod na Tesseractu
- 10:21 Task #3940 (Closed): Nelinearna difuzia pre OCR
- Otestovat vplyv nelinearnej difuzie na naskenovane textove dokumenty pre ucely OCR.
Pre rozne parametre nelinearne...
03.06.2016
- 12:50 Task #3931: Test ASR
- Pepa se díval na anotace a je to prý docela divoké. Postup - má jednoho (skoro) Bc. studenta, který dá data přes práz...
31.05.2016
- 14:19 Task #3802: Témata - unsupervised
- podívám se na dodané přepisy na disku a co se s nimi dá dělat
30.05.2016
- 10:22 Task #3932 (Closed): Získat obrazová data od ÚSTRu
- Fotky a archiválie nahrát na úložiště u PI
- 10:21 Task #3931 (Closed): Test ASR
- Otestovat automatický přepis na datech s ruční anotací od ÚSTR.
- zkontrolovat anotace
- zarovnat anotace
- pro... - 08:41 Administration, support #3776 (Resolved): Předání dat - ochrana osobních údajů
Also available in: Atom