login::  password::




cwbe coordinatez:
101
63533
8446046

ABSOLUT
KYBERIA
permissions
you: r,
system: public
net: yes

neurons

stats|by_visit|by_K
source
tiamat
K|my_K|given_K
last
commanders
polls

total descendants::26
total children::15
9 K

show[ 2 | 3] flat


bloody0
kyberbubus0
Matwe0
mateno0
čo0
JollyGoodly0
mirex0
L4ky0
Burning A0
maniac0
huno0
superpussy0
Indalam0
RastaFuck vo...0
Prospero0
risko1
aarin2
Lester3
ewenka3
asety3
tulenya5
Thanatos5
september5
cocacoala (h...8
ode8
Carpathian9
darkforce9
grzegorz brz...9
kredenc9
Forum o strojovom rozpoznavani reci.

Ak mate skusenosti s platformami ako Sphinx, Julius alebo Kaldi, tak sem s nimi.

Dominantne ASR systemy:
http://kaldi-asr.org/
https://github.com/julius-speech/julius
https://cmusphinx.github.io/

Hotword detection:
https://snowboy.kitt.ai/ (Snowboy Vam pobezi an Raspberry PI, bohuzial Vam vsak neumoznuje vytrenovat si vlastne modely a nuti Vas - podobne ako Apple ci Google - outsourcovat Vase hlasove data korporacii)

Datasety:
http://www.voxforge.org/

Ciel fora :: Vytvorenie vlastnych akustickych a jazykovych modelov.




00000101000635330844604609011786
Prospero
 Prospero      20.10.2022 - 11:55:38 (modif: 20.10.2022 - 21:03:47) [27K] , level: 1, UP   NEW !!CONTENT CHANGED!!
Minulý týždeň som vrámci súťaže "our voices" od Mozilla Foundation jemne pretrénoval už existujúci deepspeech-cs model na slovenské common voice dáta.

Výsledok je tu: https://github.com/hromi/our-voices-model-competition/tree/main/submit/Variant_Accent_Dialect/SlovakoCzech-band-C

nieje to perfektné - a ani nikdy nebude - ale pokiaľ Tvojou ambíciou nieje mať dokonalý rozpoznávač reči ktorý funguje pre všetkých, vo všetkých prostrediach a pre všetky výrazy- ale skôr niečo čo funguje dostatočne dobre pre Teba a Tvojich najbližších, a beží rýchlo aj na RaspberryPi, tak je to istotne užitočný odrazový mostík

(v release sú aj checkpoint súbory takže kludne môžeš model fine-tuniť na svoj vlastný hlas)

njoy

edit: ak si na githube a zadelíš mi hviezdičko alebo vidličko a ak náhodou v tej súťaži vyhrám platím Ti nejaké to IPA pivečko

0000010100063533084460460901178609012010
DrZak
 DrZak      20.10.2022 - 23:00:46 , level: 2, UP   NEW
Co je potrebne, aby tieto tooly vedeli proste trafit 90+ % slov a fungovat ako presny-ish translator jazykov - aj takych komplikovanejsich? Je to iba o hrubej vypocetnej sile?

000001010006353308446046090117860901201009015001
mirex
 mirex      02.11.2022 - 08:46:50 , level: 3, UP   NEW
Za Speech-to-text:
Hrubú silu + veľa pamäte na ktorej to bude bežať + veľmi veľa zozbieraných dát (audio + textový prepis) na ktorých vytrénuješ ten jazykový model + každý rok vychádzajú vylepšené software ktoré vedia lepšie používať a rozoznávať jazyky.

90+ % už existuje, má ho google, pokiaľ viem má teraz 94% pre dobre pokrytý jazyk akým je angličtina.

Ale vždy môže prísť niekto kto rozpráva nárečím alebo slangom na ktoré tie modely natrénované nie sú, a program mu nebude rozumieť, tak ako by mu nerozumel ani bežný človek, a porozumie až sa to naučí.

00000101000635330844604609011786090120100901500109015796
kyberbubus
 kyberbubus      04.11.2022 - 20:53:30 , level: 4, UP   NEW
mňa by zaujímalo, ako si takéto modely vedia poradiť napr. s prízvukmi v rámci angličtiny, aj tých bežne používaných je viac

×÷ßßß$ˇ~[☼◙ş→☻ü84ó♀ÇüŮń§►♫☺♀♂ć☺<\ˇ

0000010100063533084460460901178609012010090150010901579609015887
mirex
 mirex      05.11.2022 - 12:57:51 , level: 5, UP   NEW
No je to zasa tak isto. Ak ich trénuješ na tých prízvukoch, tak sú v tom lepšie. Ale tých dát na trénovanie je málo, lebo nie sú také bežné.
Takže úspešnosť rozoznania slov s prízvukom je trochu nižšia.

Ale keďže google má veľa peňazí, veľa dát atď. takže je dosť pravdepodobné že zahrnul nahrávky s prízvukmi do svojej testovacej sady a rozozná ich celkom dobre.

000001010006353308446046090117860901201009012167
Prospero
 Prospero      21.10.2022 - 12:18:06 , level: 3, UP   NEW
pokial vies ake slova mozes ocakavat tak mozes dosiahnut velmi velmi dobre vysledky za pouzitia specifickeho tzv. language modelu (nazyva sa aj "scorer") ktory pokryva danu slovnu zasobu

pokial nevies ake slova ocakavat tak je to trochu tazsie, tam potrebujes co najviac co najrozmanitejsich dat + nejaky ten vypocetny vykon na vytrenovanie modelu

ale toho vykonu nemusi byt ani vela ked vychadzas z modelov ktore uz existuju a robis tzv. "fine-tuning"

0000010100063533084460460901178609011820
mirex
 mirex      20.10.2022 - 13:23:56 , level: 2, UP   NEW
Super, tiez som rozmyslal ze sa tam zapojim so Slovencinou, ale nebol cas.

00000101000635330844604608963093
Prospero
 Prospero      28.03.2022 - 18:24:50 , level: 1, UP   NEW
Gentlemen & Ladies, I am honored to introduce You the lesen-mikroserver project:
https://github.com/hromi/lesen-mikroserver

Feel free to star, fork, develop, contribute and whatever

0000010100063533084460460896309308967694
JollyGoodly
 JollyGoodly      14.04.2022 - 00:11:25 , level: 2, UP   NEW
cool, ukaz nejake demo ... manual je to readme? ci prehliadol som ho?

00000101000635330844604608920539
SYNAPSE CREATOR
 Prospero      07.11.2021 - 13:23:59 (modif: 07.11.2021 - 13:24:36) [11K] , level: 1, UP   NEW  HARDLINK !!CONTENT CHANGED!!
Predpokladám že niektor(í|é) z vás si všimli červený banner "Fostering Reading Acquisition with Digital Tools" ktorý bol do dnešného dňa zavesený na hlavnej stránke.

Banner viedol na túto adresu: https://digieduhack.com/en/digieduprimer kde je popísaný hackathon na ktorého organizácii už pár mesiacov pracujem a ktorý sa má začať tento útorok o desiatej ráno tu https://fibel.digital/main

Napriek tomu že event propagujem kde sa dá, stále sa mi nedarí dosiahnuť počet účastníkov ktorý by sa blížil ku kritickej hodnote kde strojové učenie umožní, že sa začnú diať veci nevídané a začnú byť čuté veci dosiaľ nepočuté...

Možno je to spôsobené tým že už nejaký ten piatok žijeme v svete kde elán vital akýmsi záhadným spôsobom mizne v /dev/null ale možno aj tým že neviem robiť promo...

Tak či onak, chcel by som Ťa/Vás poprosiť, pokiaľ máš v utorok chvíľu čas a nieje Ti ľahostajná gramotnosť žiakov doby (post)covidovej, aby si zaregistroval(a) tu: https://digieduhack.com/en/participate?organisation_id=612 *

Je možné vyhrať aj nejaké tie ceny, ako na úrovni "reading fostering challenge" ktorú organizujem ja, tak na európskej úrovni (5000 eur).

Vďaka za pozornosť
Daniel

* ak sa Ti nechce registrovať ale stále chceš byť pritom ako anonymná dobromyseľ, tak vedz že súradnice verejnej matrix miestnosti sú #event-digieduprimer:m3x.baumhaus.digital...ak do matrixu ešte prístup nemáš tak sa mi ozvi do pošty, rád Ti jeden vytvorím

00000101000635330844604608837762
SYNAPSE CREATOR
 Prospero      04.02.2021 - 22:13:52 [2K] , level: 1, UP   NEW  HARDLINK
COVID-19 Artificial Intelligence Diagnosis Using Only Cough Recordings
https://ieeexplore.ieee.org/document/9208795

Goal: We hypothesized that COVID-19 subjects, especially including asymptomatics, could be accurately discriminated only from a forced-cough cell phone recording using Artificial Intelligence. To train our MIT Open Voice model we built a data collection pipeline of COVID-19 cough recordings through our website (opensigma.mit.edu) between April and May 2020 and created the largest audio COVID-19 cough balanced dataset reported to date with 5,320 subjects. Methods: We developed an AI speech processing framework that leverages acoustic biomarker feature extractors to pre-screen for COVID-19 from cough recordings, and provide a personalized patient saliency map to longitudinally monitor patients in real-time, non-invasively, and at essentially zero variable cost. Cough recordings are transformed with Mel Frequency Cepstral Coefficient and inputted into a Convolutional Neural Network (CNN) based architecture made up of one Poisson biomarker layer and 3 pre-trained ResNet50's in parallel, outputting a binary pre-screening diagnostic. Our CNN-based models have been trained on 4256 subjects and tested on the remaining 1064 subjects of our dataset. Transfer learning was used to learn biomarker features on larger datasets, previously successfully tested in our Lab on Alzheimer's, which significantly improves the COVID-19 discrimination accuracy of our architecture. Results: When validated with subjects diagnosed using an official test, the model achieves COVID-19 sensitivity of 98.5% with a specificity of 94.2% (AUC: 0.97). For asymptomatic subjects it achieves sensitivity of 100% with a specificity of 83.2%. Conclusions: AI techniques can produce a free, non-invasive, real-time, any-time, instantly distributable, large-scale COVID-19 asymptomatic screening tool to augment current approaches in containing the spread of COVID-19. Practical use cases could be for daily screening of students, workers, and public as schools, jobs, and transport reopen, or for pool testing to quickly alert of outbreaks in groups. General speech biomarkers may exist that cover several disease categories, as we demonstrated using the same ones for COVID-19 and Alzheimer's.

00000101000635330844604608796737
mirex
 mirex      19.10.2020 - 19:37:23 , level: 1, UP   NEW
Kaldi sa transformuje na K2, ktore bude postavene viac na Pythone, prebiehaju diskusie o tom kam sa ma uberat.

Info, a videonahravky diskusii:
https://www.kaldi.dev

1. Kaldi ASR: Research and Academic Users
2. Kaldi ASR: Applications and Industry Users
3. Deep Learning Frameworks: Trends and Outlook

00000101000635330844604608744197
mirex
 mirex      28.04.2020 - 09:39:29 [1K] , level: 1, UP   NEW
https://github.com/ottokart/punctuator2
A bidirectional recurrent neural network model with attention mechanism for restoring missing inter-word punctuation in unsegmented text.

How well does it work?
* A working demo can be seen here: http://bark.phon.ioc.ee/punctuator
* You can try to compete with this model here: http://bark.phon.ioc.ee/punctuator/game

Trénujeme teraz modely pre Francúžštinu a Nemčinu, ale trvá to sakra dlho... veľa pokusov a omylov. Na malých korpusoch nie sú výsledky uspokojivé, a na veľkých korpusoch aa nedá odhadnúť ako dlho bude to trénovanie trvať (koľko dní na výkonnom 8-jadre).

00000101000635330844604608741705
mirex
 mirex      21.04.2020 - 11:04:30 (modif: 21.04.2020 - 11:11:15) [1K] , level: 1, UP   NEW !!CONTENT CHANGED!!
Pohľad firmy DataIku na to, ako sa bude vyvíjať zmena pozícií AI a Machine Learning odborníkov, a ako sa bude vyvíjať biznis:
2020_ai_trends_for_the_new_decade_data_iku.pdf (5mb pdf)

src: https://blog.dataiku.com/whats-hot-2020-ai-trends

edit: oprava linku.

00000101000635330844604608570447
SYNAPSE CREATOR
 Prospero      30.11.2018 - 00:21:51 (modif: 30.11.2018 - 00:37:09) [5K] , level: 1, UP   NEW  HARDLINK !!CONTENT CHANGED!!
Hello world,

hlada sa niekto, kto mi pomoze s vytvorenim digitalneho slabikara pre deti prveho stupna zakladnej skoly. Vcera bola zverejnena oficialna vyzva, deadline na odovzdanie podkladov (LoI, CV etc.) je 19. december.

Dvojtretinovy uvazok, nastupny tabulkovy plat tu: http://oeffentlicher-dienst.info/c/t/rechner/tv-l/berlin?id=tv-l-berlin&g=E_13&s=1&zv=VBL&z=67

Tu je text vyzvy:
https://www.udk-berlin.de/fileadmin/2_dezentral/FR_Stellenausschreibungen/Anz_2_1530_18_ohne_Link.pdf

Vyzva je sice po nemecky, ale znalost nemciny nieje podmienkou, staci dobra anglictina...

Nutnou podmienkou je ukoncene vysokoskolske vzdelanie (staci Master).

Verim ze sa s niekym z Vas uvidim na pohovore.
D.

P.S. pripadne otazky rad zodpoviem na dh@udk-berlin.de, na kybci teraz lockout

00000101000635330844604608551251
Prospero
 Prospero      05.10.2018 - 20:30:51 , level: 1, UP   NEW
Keby si niekto chcel zbastlit vlastny ASR, tak tuto ::
https://github.com/dspavankumar/compute-mfcc

treba. IMHO, zacat.

00000101000635330844604608532682
Prospero
 Prospero      10.08.2018 - 13:15:14 , level: 1, UP   NEW
na https://voice.mozilla.org/en/data je fajn multiGB dataset, a tiez je tam par zaujimavych linkov na externe veci, Librispeech ( https://www.openslr.org/12 ) a Voxforge ( http://www.repository.voxforge1.org/downloads/SpeechCorpus/Trunk/ ) uz som poznal, ale aj to TED-lium vyzera fajne (54GB!!!)

hlavne mi vsak urobil radost ten tatoeba project https://tatoeba.org/eng/downloads , pretoze je

1) viacjazycny (napr. pre nemcinu je tam > 16 tisic nahravok)
2) sentence-based (t.j. co nahravka, to veta ... a to je takmer uplne idealna situacia pre trenovanie TTS / ASR systemov)

00000101000635330844604608478848
RastaFuck von Plachta
 RastaFuck von Plachta      29.03.2018 - 14:49:58 , level: 1, UP   NEW
https://www.root.cz/zpravicky/pro-cesky-common-voice-uz-se-sbiraji-nahravky-pridejte-se


Flicker
Żubr żuł żuchwą żurawinę

00000101000635330844604608467052
SYNAPSE CREATOR
 RastaFuck von Plachta      07.03.2018 - 14:56:02 [2K] , level: 1, UP   NEW  HARDLINK
vybornyy clanok, odporucam
https://www.lupa.cz/clanky/tomas-mikolov-facebook-siri-cortana-ci-alexa-jsou-hloupe-zapadu-muze-ve-vyvoji-ai-ujet-vlak/


Flicker
Żubr żuł żuchwą żurawinę

00000101000635330844604608457109
JollyGoodly
 JollyGoodly      15.02.2018 - 10:41:09 , level: 1, UP   NEW
skusali ste niekto https://github.com/buriburisuri/speech-to-text-wavenet ?

00000101000635330844604608447141
smrtak
 smrtak      22.01.2018 - 18:25:59 [1K] , level: 1, UP   NEW
https://theintercept.com/2018/01/19/voice-recognition-technology-nsa/

00000101000635330844604608446350
paradigm shift
 paradigm shift      20.01.2018 - 10:57:04 [2K] , level: 1, UP   NEW

00000101000635330844604608446093
mirex
 mirex      19.01.2018 - 13:39:35 (modif: 22.01.2018 - 15:00:38), level: 1, UP   NEW !!CONTENT CHANGED!!
Mimochodom, mame 1,5 cloveka ktori na plny uvezok pracuju na hladani co najlepsieho modelu, treningu modelov, porovnavanie word-error-rate a hladanie optimalnych parametrov. A iba pre anglictinu to trvalo povedzme rok, kym to bolo take, ako by sme chceli. Teda dobry kompromis medzi kvalitou a velkosti v pamati.

TLDR: trenovanie modelu po vikendoch bude trvat sakra dlho.

edit: a este k tomu ludia okolo Kaldi stale vynachadzaju nove 'recipees' alebo pristupy ako pouzit vyhladavanie cez neuronove siete, aj.

00000101000635330844604608446089
mirex
 mirex      19.01.2018 - 13:36:29 , level: 1, UP   NEW
V praci vyvijame software s voice-recognition (a viac o nom nemozem povedat), pred rokom sme presli z home-made-algoritmu na Kaldi. Kompilovane hlavne na windows c++ 64bit s visual studiom, ale budeme to pouzivat aj pre linux.

Pouzivame zavislosti OpenBlas (IntelMKL sme opustili, komercny, vacsie binarky a vykon sa zda byt rovnaky), OpenFst a Pthreads (v novej verzii ho uz zda sa netreba)

Preco myslis ze je Atlas najlepsia moznost? Merania ludi ukazuju ze OpenBlas ma lepsi vykon
https://groups.google.com/forum/#!topic/kaldi-help/NIgYFK64lk8
http://gcdart.blogspot.sk/2013/06/fast-matrix-multiply-and-ml.html


No a na trenovanie kvalitnych modelov s nizkym word-error-rate treba zial velmi vela hodin hovoreneho slova + textoveho prepisu. A pre slovensky jazyk toho asi nie je dost. Niekto mi hovoril ze je vhodne mat tak 100 hodin.

Je tu velmi pekny projekt od mozzily, zatial iba anglicky korpus, ale 254 hodin!
https://voice.mozilla.org/

0000010100063533084460460844608908450047
RastaFuck von Plachta
 RastaFuck von Plachta      29.01.2018 - 22:05:36 , level: 2, UP   NEW
a daju sa na to pouzit nahovorene knihy napriklad?
tam y sa dalo nazbierat nejake hodiny, ci ?


Flicker
Żubr żuł żuchwą żurawinę

000001010006353308446046084460890845004708450064
mirex
 mirex      29.01.2018 - 22:33:42 , level: 3, UP   NEW
ano, ale mal by to byt dobry prepis/nahovorenie; sucasny jazyk; a rozny recnici

00000101000635330844604608446089084500470845006408450076
akira
 akira      29.01.2018 - 23:23:14 (modif: 29.01.2018 - 23:29:04), level: 4, UP   NEW !!CONTENT CHANGED!!
Dominik Dan, knihy splnaju skoro vsetko (su prepisy na internete, pripadne sa da nejaka kniha zocrkovat, alebo vylupit e-kniha), az na to ze to nacitali len Vajda a Geisberg. Rozni recnici su pri audioknihach problem.

0000010100063533084460460844608908450047084500640845007608450158
mirex
 mirex      30.01.2018 - 10:12:26 , level: 5, UP   NEW
Problem je aj to, ze audioknihy citaju dobri recnici s dobrou a jasnou vyslovnostou. Potom pride bezny tichy programator alebo suslavy teenager a neuralna siet mu uz neporozumie.

Dobry projekt je ten https://voice.mozilla.org/ kde hocikto pridava audio ... pustal som si tam zopar nahravok a ludia do mikrofonu hovoria fakt velmi zle ... a ked som si sputil moje nahravky tak som zistil ze ja tiez ;-)

Treba do nich stuchnut nech to spustia aj pre slovencinu, chceli to spustit pre rozne jazyky.

00000101000635330844604608446062
Prospero
 Prospero      19.01.2018 - 13:02:03 (modif: 19.01.2018 - 13:04:39), level: 1, UP   NEW !!CONTENT CHANGED!!
Po uspesnej instalacii Kaldi mozes otestovat prvy model spustenim egs/voxforge/online_demo/run.sh

V pripade ze to nepojde kvoli tomu ze nebudes vediet najst "online-wav-gmm-decode-faster" tak si asi pred kompilaciou Kaldi zabud(ol|la) nainstalovat portaudio

tools/install_portaudio.sh

potom:

cd src/onlinebin
make

a voila, prave si skompilovala? state-of-the-art tooly na spracovanie real-time speech.

Ked potom znova spustis

egs/voxforge/online_demo/run.sh --test-mode live

mozno Ta prekvapi ze vsetko pojde ako po masle a mozes rovno diktovat.

Aspon na mojom stroji (Linux Mint starsieho data) Kaldi krasne obide pulseaudio, napoji sa cez portaudio na ALSU a je to...

00000101000635330844604608446052
Prospero
 Prospero      19.01.2018 - 12:51:56 (modif: 19.01.2018 - 15:35:22), level: 1, UP   NEW !!CONTENT CHANGED!!
Prave som si nainstaloval KALDI ( http://kaldi-asr.org ), miestami to bol trochu boj.

Najme si pri kompilacii treba davat pozor na poradie na to ako sa includuju jednotlive pomocne kniznice, ak sa rozhodnes vyuzit na-vlastnom-stroji-skompilovany libatlas (najlepsia zo vsetkych moznosti), tak poradie kniznic v src/kaldi.mk musi byt

ATLASINC = /usr/local/atlas/include
ATLASLIBS = /usr/local/atlas/lib/libf77blas.a /usr/local/atlas/lib/liblapack.a /usr/local/atlas/lib/libcblas.a /usr/local/atlas/lib/libatlas.a

alebo nieco podobne...

T.j. to najdolezitejsie (libatlas) na koniec

V opacnom pripade budes (s najvacsou pravdepodonostou) konfrontovan(y|a) s jednym z problemov ktore su popisane tu:
http://kaldi-asr.org/doc/matrixwrap.html

P.S. kniznica utomatically Tuned Linear Algebra Software (ATLAS) sa dost brutalnym sposobom adaptuje na najhlbsie internals Tvojho stroja ... takze jej kompilacia chvilu trva, ale hladiet na outputy tych testov je celkom zazitok...long live FORTRAN!

dendrite Čítanka pre urodzené slečny, level 0
dendrite COVID-19 Artificial Intelligence Diagnosis Using Only Cough Recordings
dendrite ponuka prace :: hlada sa Wissenschaftliche Mitarbeiter(in) na Berlin University of the Arts
dendrite 07.03.2018-14:56:02
axone main
axone neuronove siete
axone machine learning - practical. Marketing, content monetization
axone umela inteligencia
axone forumz