Activity
From 02.06.2016 to 01.07.2016
01.07.2016
- 13:08 HQSYN16 Task #3941 (Resolved): Create synthesis logs for corpora with altered prosodic words
- After a week of troubles, I have finally managed to get the experiment working.
Resulting logs are stored to @Exper... - 11:22 NAKI-II-USTR-UKONCENE Administration, support #3967 (Closed): Roční zpráva pro MK
- *15.11. - souhrnná písemná periodická zpráva*
- zašlete v listinné a elektronické podobě k rukám příslušné administr... - 11:20 NAKI-II-UJC-UKONCENE Administration, support #3966 (Closed): Roční zpráva pro MK
- *15.11. - souhrnná písemná periodická zpráva*
- zašlete v listinné a elektronické podobě k rukám příslušné administr...
30.06.2016
- 14:50 NAKI-II-UJC-UKONCENE Task #3928: bezdrátová sluchátka pro jazykovou poradnu
- VXI-BlueParrott-B350-XT-EU - specifikována do nákupu Amalach.
- 12:41 HQSYN16 Task #3965 (Closed): EMA - Radka Mašková
- _Parent task for EMA based experiment with Radka Mašková_
29.06.2016
- 13:49 NAKI-II-USTR-UKONCENE Task #3804: unsupervised shlukování obrázků
- shlukování vstupních dokumentů (BoW)
klasifikace typu vstupního dokumentu do tříd (obrázek, ručně psaný text, ...) - 13:46 NAKI-II-USTR-UKONCENE Task #3957: OCR - čtení hlavičky/nadpisu dokumentu
- analýza lokace, velikosti textového bloku...
čtení a zjištění co v tom je.
28.06.2016
- 14:43 NAKI-II-USTR-UKONCENE Task #3932: Získat obrazová data od ÚSTRu
- Máme větší vzorek dat - viz adresář ARCHIVALIE PAMĚTNÍKU BEZ VODOZNAKU
27.06.2016
- 15:17 NAKI-II-USTR-UKONCENE Task #3962 (Closed): Porovnat výsledky na OCR pro náš výsledek z TesseractApi a z modelu trénovaného v Tesseract
- porovnat metody z #3960 a #3961
- 15:15 NAKI-II-USTR-UKONCENE Task #3961 (Closed): Dekódování grapheme-lattice na word-lattice
- Z grafémových lattice získat word-lattice pro dlaší zpracování (rescorování s jinými jaz.modely, detekce tématu atd.)
- 15:12 NAKI-II-USTR-UKONCENE Task #3801: Úprava Pixly
- * dohodnout si harmonogram prací
* vkládání obrázků do Pixly
* vkládání dat a jejich tagování - 15:11 NAKI-II-USTR-UKONCENE Task #3960 (Closed): Natrénovat vlastní LM pro Tesseract dle jejich receptu
- 15:05 NAKI-II-USTR-UKONCENE Task #3959 (Closed): Tvorba LM
- LM
- z přepsaných a zarovnaných anotací od ÚSTRU (#3931)
- získat další data od ÚSTRU: knihy, texty bez zvuku, anot... - 14:58 NAKI-II-USTR-UKONCENE Task #3875 (Closed): Zjistit jak dostat z Tesseractu lattices pro další zpracování/rescoring
- 14:56 NAKI-II-USTR-UKONCENE Task #3803: OCR - jazykový model v Tesseractu
- * zatím lze získat z OCR jen 1Best hypotézu, ale zle získat fonémový lattice (slovní lattice asi nedostupný) - lze pa...
- 14:50 NAKI-II-USTR-UKONCENE Task #3957 (Closed): OCR - čtení hlavičky/nadpisu dokumentu
- k určení tématu/klasifikace dokumentu
- 14:48 NAKI-II-USTR-UKONCENE Task #3804: unsupervised shlukování obrázků
- vyzkoušet na nových datech od ÚSTRU (pokud je jich dost)
- 14:41 NAKI-II-USTR-UKONCENE Task #3804: unsupervised shlukování obrázků
- * unsupervised algoritmy shlukování (otestovat na učesaných prepisech z ÚSTR)
* najít podobná audia jako vzor (označ... - 14:35 NAKI-II-USTR-UKONCENE Task #3954 (Closed): SW ALIGN
- JVP se studentem finalizují SW *ALIGN* - "software pro podporu poloautomatického zarovnání nahrávek s existujícími př...
- 14:33 NAKI-II-USTR-UKONCENE Administration, support #3953 (Closed): připravit mlčenlivost pro studenta
- připravit mlčenlivost pro studenta JVP - Align a učesání trénovacích dat.
24.06.2016
- 15:42 HQSYN16 Task #3709 (Closed): Merge ASF files (segmentations) and SNT files (annotations)
- 15:41 HQSYN16 Task #3709 (Resolved): Merge ASF files (segmentations) and SNT files (annotations)
- *Summary*
Voices wih merged ASFs:
* Czech voices: AJ, JS, KI, MR, SK, TJ
* Slovak voice: MM
ASF file for the ...
23.06.2016
- 16:48 HQSYN16 Task #3844 (Assigned): Analyze utterances with phonetically incorrect phoneme
- The same as before, but now for _male_ voice (Jan, spkr_AJ) - data put as attachment on [[Task_3688|wiki]].
- 16:45 HQSYN16 Task #3935 (Closed): Add classifier scripts to SVN
- 16:03 NAKI-II-USTR-UKONCENE Task #3803: OCR - jazykový model v Tesseractu
- Oficiální popis tréninku LM zde:
https://github.com/tesseract-ocr/tesseract/wiki/tesstrain.sh
Není mi z toho jas... - 15:17 NAKI-II-USTR-UKONCENE Task #3803: OCR - jazykový model v Tesseractu
- Před jazkyovým modelel bude třeba také asi natrénovat na font "psací stroj". Návod by mohl být zde: http://www.joyofd...
- 15:06 NAKI-II-USTR-UKONCENE Task #3875: Zjistit jak dostat z Tesseractu lattices pro další zpracování/rescoring
- Napojení na API + testovací prográmek hotov. Lze vypsat pro každý grafém jeho varianty s confidence. Otázka je, jestl...
- 11:43 NAKI-II-USTR-UKONCENE Task #3875: Zjistit jak dostat z Tesseractu lattices pro další zpracování/rescoring
- Prozatím mám způsob jak dostat lattices s grafémy. Je třeba se napojit na API a trochu programování v C++, ale je to ...
- 12:28 HQSYN16 Task #3922 (Closed): Synthesize utterances with phonetically incorrect phoneme realizations - voice Jan
- Data were put to [[Task_3688|wiki]].
22.06.2016
- 13:02 NAKI-II-USTR-UKONCENE Task #3950 (Closed): Vygenerovat validacnu sadu pre OCR
- 12:19 NAKI-II-USTR-UKONCENE Task #3950 (Resolved): Vygenerovat validacnu sadu pre OCR
- Vybráno a připraveno 5 souborů včetně přepisů. různá kvalita OCR (některé skoro celé OK, jiné naprosto hrozné).
+...
21.06.2016
- 17:27 NAKI-II-USTR-UKONCENE Task #3940 (Closed): Nelinearna difuzia pre OCR
- 14:39 NAKI-II-USTR-UKONCENE Task #3951 (Assigned): Testovanie nelinearnej difusie na validacnych dokumentoch
- 14:38 NAKI-II-USTR-UKONCENE Task #3951 (Closed): Testovanie nelinearnej difusie na validacnych dokumentoch
- Pre siroku skalu parametrov nelinearnej difusie spustit OCR na sade anotovanych obrazkov, ktore vznikli v #3950.
- 14:33 NAKI-II-USTR-UKONCENE Task #3950 (Closed): Vygenerovat validacnu sadu pre OCR
- Pripravit minimalne 3 obrazky roznej kvality (bad/mediocre/good).
Prepisat dokumenty pre ucely automatickeho vyhodno... - 13:33 HQSYN16 Task #3844 (Resolved): Analyze utterances with phonetically incorrect phoneme
- The second round of auditory analyses did not reveal any new information. The conclusions and recommendations from th...
- 11:30 HQSYN16 Task #3949 (Closed): G-P conversion of foreign words
- Basic forms of foreign words are typically transcribed correctly, but the transcription (and hence the synthesized pr...
20.06.2016
- 06:47 NAKI-II-USTR-UKONCENE Task #3940 (Resolved): Nelinearna difuzia pre OCR
- Zjištění ohledně nelineární difuze:
- Parametry jsou opravdu hodně citlivé. Změnou o jednotku se můžou části text...
17.06.2016
- 13:09 NAKI-II-UJC-UKONCENE Task #3946: Data pro LM
- Martin Prošek:
- elektronická Internetová jazyková příručka (http://prirucka.ujc.cas.cz/)
- poradenská databázi v... - 08:28 HQSYN16 Task #3922: Synthesize utterances with phonetically incorrect phoneme realizations - voice Jan
- Update: after diphone list fixes, new images are stored in @Experiments/NoUnitSubsts/spkr_AJ_rev652.[baseline/nosubst...
16.06.2016
- 16:30 HQSYN16 Task #3941: Create synthesis logs for corpora with altered prosodic words
- File *pros_words.py* contains function *set_pwords( unit_list, ver=1 )* where
* *unit_list* is a list of units == ... - 12:07 NAKI-II-UJC-UKONCENE Task #3946 (Closed): Data pro LM
- - emaily a přepisy nahrávek z Jazykové poradny (na poli [[https://wikky.zcu.cz/redmine/projects/naki-ii-ujc/wiki]])
... - 08:58 NAKI-II-UJC-UKONCENE Task #3706: SW SADA - návrh rozhraní
- Návrh Gui:
- 08:55 NAKI-II-UJC-UKONCENE Administration, support #3859: VoiP
- VoiP zařízen od Axfone (i s přenesením čísla), čeká se jen na SW pro hahrávání hovorů (úprava zdrojových kódů Linphone).
15.06.2016
- 12:14 NAKI-II-UJC-UKONCENE Task #3945 (Closed): Identifikace pohlaví a totožnosti poradníka
- Použít stejné jako máme v SIDu
- online?
- chce to Aleš pro výběr AM v ASR? - 10:23 HQSYN16 Task #3944 (Closed): Commit changes based on user(s) logged in/out
- Would it be possible (and not too difficult) to trigger commit of ASF changes when all users working on the given lan...
13.06.2016
- 10:53 HQSYN16 Task #3941 (Feedback): Create synthesis logs for corpora with altered prosodic words
- I will need a python script assigning new _PWord_ tags to a sequence of phones (or preferably ASF units). Then I can ...
- 10:35 HQSYN16 Task #3922 (Resolved): Synthesize utterances with phonetically incorrect phoneme realizations - voice Jan
- Both baseline (with substitutions) and new (no substitutions) were copied to ARTIC data, path: @Experiments/NoUnitSub...
- 10:04 HQSYN16 Task #3813 (Closed): Submit a paper for INTERSPEECH2016 (D)
- Accepted :-)
- 09:30 HQSYN16 Task #3809 (Closed): Submit a paper for INTERSPEECH 2016
- Unfortunately rejected ...
10.06.2016
- 10:44 HQSYN16 Task #3935 (Resolved): Add classifier scripts to SVN
- There were several modification of the scripts carried out. Here I describe them with a few warnings:
*JSON output...
09.06.2016
- 12:57 HQSYN16 Task #3922: Synthesize utterances with phonetically incorrect phoneme realizations - voice Jan
- Nosubst image of the voice is needed for the last step of synthesis.
- 12:56 HQSYN16 Task #3941 (Closed): Create synthesis logs for corpora with altered prosodic words
- Can you create synthesis logs for corpora with altered prosodic words? All ASFs are placed in @artic/Experiments/pros...
- 11:37 HQSYN16 Task #3806 (Resolved): "mlýneček" sounds like "mlýmeček"
- Percepce místa artikulace závisí na tranzientu druhého formantu (F2). Jako tradiční akustický korelát místa artikulac...
07.06.2016
- 15:22 NAKI-II-USTR-UKONCENE Administration, support #3776 (Closed): Předání dat - ochrana osobních údajů
- Data mohou být v rámci akademického zporacování předána nám pouze s smlouvou o předání dat (bez posvěcení ÚOOÚ).
- 15:21 NAKI-II-USTR-UKONCENE Administration, support #3800 (Closed): GUI - odpovědný pracovník
- 15:19 NAKI-II-USTR-UKONCENE Administration, support #3800 (Resolved): GUI - odpovědný pracovník
- Petr Stanislav upravý SW z jiných prostředků (stipendium újč) - postupně bude práci (pokud půjde i stipendiu = další ...
- 15:20 NAKI-II-USTR-UKONCENE Task #3799 (Closed): test ASR
- 15:16 NAKI-II-USTR-UKONCENE Task #3931: Test ASR
- Pepa slíbil, že kontaktuje studenta, zda je schopný přepisy učesat do konce července, aby jsme nečekali nakonec až do...
- 10:22 NAKI-II-USTR-UKONCENE Task #3818 (Closed): Testovanie metod na Tesseractu
- 10:21 NAKI-II-USTR-UKONCENE Task #3940 (Closed): Nelinearna difuzia pre OCR
- Otestovat vplyv nelinearnej difuzie na naskenovane textove dokumenty pre ucely OCR.
Pre rozne parametre nelinearne...
03.06.2016
- 12:50 NAKI-II-USTR-UKONCENE Task #3931: Test ASR
- Pepa se díval na anotace a je to prý docela divoké. Postup - má jednoho (skoro) Bc. studenta, který dá data přes práz...
Also available in: Atom