|
|
|
fonemy języka polskiego |
<-Zobacz poprzedni temat :: Zobacz następny temat-> |
Autor |
Wiadomość
|
johnyjj2
|
Wysłany: Sob 17:18, 14 Lis 2009 Temat postu: fonemy języka polskiego |
|
|
Dołączył: 13 Lis 2009
Posty: 5
Przeczytał: 0 tematów
|
Witam!
Potrzebna jest mi wiedza dotycząca fonemów występujących w języku polskim. Otóż pracuję nad pewnym projektem informatycznym związanym z rozpoznawaniem mowy. Na stronie VoxForge są darmowe modele akustyczne dla kilku języków, m.in. angielskiego, hiszpańskiego, włoskiego, ale nie ma języka polskiego, stąd też zamierzam wspomóc ten projekt .
Chciałbym stworzyć listę fonemów podobną do tej ht [link widoczny dla zalogowanych] w.speech.cs.cmu.edu/cgi-bin/cmudict . Pewna osoba zasugerowała mi książkę Wiśniewskiego "Fonetyka i fonologia", do której jednak nie mam dostępu. Muszę przygotować słownik języka polskiego, w którym dostępne będą wyrazy na dwa sposoby - ich zwykły zapis oraz fonetyczna wymowa, przy użyciu listy fonemów, którą zamierzam wykonać. Stąd też byłbym wdzięczny, jeśli może mi ktoś pomóc ze stworzeniem takiej listy fonemów i wskazaniem elektronicznej wersji słownika j. polskiego z zapisem fonetycznym.
Tak sobie myślę, że mając słownik z rozpisem słów w IPA oraz tabelkę, w której bym porównał moją listę fonemów z listą IPA (ht [link widoczny dla zalogowanych] rg/wiki/Wikipedia:IPA_for_Polish), nie byłoby większych problemów ze stworzeniem takiego modelu akustycznego. Może taką listę fonemów dałoby się stworzyć najzwyczajniej w świecie, wymyślając dwuliterowe skróty (składające się tylko z liter alfabetu łacińskiego) dla znaczków IPA. Niemniej konieczny byłby wtedy słownik z wymową fonetyczną, stąd też proszę o wskazanie mi takiego, najlepiej w wersji elektronicznej.
Pewna osoba zasugerowała mi pomoc w stworzeniu takiego modelu dla j. polskiego i zadała mi pytanie "które fonemy eSpeak odpowiadają polskim fonemom IPA?". Nie do końca zrozumiałem, o co tej osobie chodzi. Swoje pytanie zawarłem tutaj: ht tps:/ /sourceforge.n et/projects/espeak/forums/forum/538922/topic/3458345 .
Podsumowując, przede wszystkim potrzebuję elektroniczną wersję słownika j. polskiego z zapisem fonetycznym słów, na drugim zaś miejscu pomocy w stworzeniu listy fonemów lub sugestii (np. czy dobrym pomysłem jest po prostu wykorzystać IPA, zamieniając nazwy skrótów).
Pozdrawiam!
PS We wszystkich adresach należy usunąć spacje.
Post został pochwalony 0 razy
|
|
Powrót do góry |
|
|
|
|
Karen
|
Wysłany: Czw 16:15, 19 Lis 2009 Temat postu: |
|
|
Dołączył: 14 Lut 2008
Posty: 225
Przeczytał: 0 tematów
Pomógł: 12 razy
|
johnyjj2,
listę fonemów języka polskiego znajdziesz w wikipedii pod hasłem "Fonetyka języka polskiego". Są tam też ciekawe podnośniki do poszczególnych głosek, w tym także odwołania do podobnie brzmiących głosek w innych językach. Szukać możesz także w każdej książce do gramatyki opisowej języka polskiego.
Co do CMU Pronouncing Dictionary, to zwróć uwagę, że jest to słownik na bazie języka angielskiego: czy tworząc polską listę również oprzesz się na nim? ciekawie to będzie wyglądać. Pozostałabym przy IPA (w końcu po to go opracowano).
Inicjatywa ciekawa, powodzenia!
Post został pochwalony 1 raz
|
|
Powrót do góry |
|
|
johnyjj2
|
Wysłany: Nie 22:26, 20 Gru 2009 Temat postu: |
|
|
Dołączył: 13 Lis 2009
Posty: 5
Przeczytał: 0 tematów
|
Dzięki za odpowiedź!
Czy są jakieś słowniki (najlepiej w wersji elektronicznej), które zawierają listę wszystkich słów wraz z ich zapisem fonetycznym IPA? Tylko niewielka grupa słow jest dostępna wraz z transkrypcją na wikisłowniku (wikidictionary).
Tak wygląda moja lista IPA (na wikipedii nie znalazłem kompletnego wykazu fonemów, informacje były porozrzucane po całym artykule): ht tp:/ /images40.fotosik.p l/236/3e440e25ee439bcd.jpg . Ponieważ transkrypcje zapisuję w pliku tekstowym, byłem zmuszony zamienić znaki IPA na jedno- lub dwuliterowe skróty.
Czy mógłbym prosić o zapisanie mi przy pomocy IPA pewnej listy słów? Niestety, nie jest to takie proste, jak najzwyczajniej przepisanie liter bądź dźwięków zapisywanych dwiema literami, za to w innej formie. Trochę bardziej skomplikowanie wygląda tworzenie zapisu IPA, niż zwykłe odwzorowanie jeden do jednego. (Choć i tak dla j. polskiego jest to dużo prostsze, niż np. dla j. angielskiego, w którym większość wyrazów czyta się inaczej, niż pisze).
Lista słów jest następująca: pomoc nastepna szczegoly okej pomin koniec podstawowy rozszerzony wyslij potwierdzam blad pomylka zle gliwice katowice wroclaw pyskowice wróć pierwsza druga trzecia czwarta piata szosta siodma osma dziewiata ostatnia poczatkowa srodkowa bocznica kolejowa cofnij ponow zapisz wczytaj rozpoznaj szukaj zamknij pomocnicze nagraj odtworz przeskocz nierozpoznana dodatkowa seria wagonow numery ilosc osi ladowanych proznych obliczen tony waga ładunku ogolny ciezar rzeczywisty hamowania stacja nadania przeznaczenia skrot dyrektora wezla uwagi.
Moja dotychczasowa lista wygląda tak:
ZERO Z E R O
JEDEN J E D E N
DWA D W A
TRZY T SZ Y
CZTERY CZ T E R Y
CZTERY(2) T SZ T E R Y
PIEC P J EE NG CI
SZESC SZ E SI CI
SZESC(2) SZ E SI T SI
SIEDEM SI E D E M
OSIEM O SI E M
DZIEWIEC D ZI E W J EE NG CI
TAK T A K
NIE NG E
KONIEC K O NG E C
DALEJ D A L E J
POMYLKA P O M Y LY K A
Z góry dziękuję!
Pozdrawiam!
PS Proszę usunąć spacje w linku do strony fotosik.pl.
Post został pochwalony 0 razy
Ostatnio zmieniony przez johnyjj2 dnia Śro 4:19, 30 Gru 2009, w całości zmieniany 1 raz
|
|
Powrót do góry |
|
|
Karen
|
Wysłany: Wto 13:53, 29 Gru 2009 Temat postu: |
|
|
Dołączył: 14 Lut 2008
Posty: 225
Przeczytał: 0 tematów
Pomógł: 12 razy
|
johnyjj2, mieszasz systemy językowe; IPA jest pewnym międzynarodowym uśrednieniem dźwięków, które pozwala zapisać wszystkie głoski; IPA to alfabet, jeśli zmieniasz to na litery alfabetu łacińskiego, to nie jest to już IPA.
Ponadto Twoje propozycje opierają się na różnych systemach:
jeżeli zapisujesz "trzy" jako "tszy", wyrażasz tylko tzw. ubezdźwięcznienie, które występuje w "rz" pod wpływem t; poza Polakiem nikt tego nie zrozumie, ponieważ "sz" występuje jako zapis głoski [sz] tylko w naszym języku.
A zapis "ng" jako "ń" - nie wiem, czy to zrozumiałe.
Post został pochwalony 0 razy
|
|
Powrót do góry |
|
|
johnyjj2
|
Wysłany: Śro 4:13, 30 Gru 2009 Temat postu: |
|
|
Dołączył: 13 Lis 2009
Posty: 5
Przeczytał: 0 tematów
|
Witam!
Rzecz jest prosta, wystarczy rzucić okiem tutaj: ht tp:/ /images40.fotosik.p l/236/3e440e25ee439bcd.jpg (proszę usunąć spacje). Żeby jednak nie było niejasności, wyjaśnię to trochę dokładniej:
Otóż rzecz wygląda tak, że w pliku tekstowym (txt, tworzony w notatniku) nie zapiszę wszystkich znaków używanych w IPA, właściwie to większości z nich nie zapiszę, jeśli chcę używać standardowego kodowania znaków. Problemy z kodowaniem znaków pojawiają się czasem już z polskimi literami (ąęłó itd.). Problemów z kodowaniem w plikach uniknąć da się w najprostszy sposób - używając jedynie liter z j. angielskiego.
Ja bym się upierał, że jednak to jest IPA. Najzwyklejsze odwzorowanie jeden do jednego. Jeden konkretny znak IPA - jeden konkretny skrót jedno- lub dwuliterowy, zapisany alfabetem łacińskim. Mając takie odwzorowanie jeden do jednego dla każdego ze znaków IPA, który występuje w j. polskim, mogę zapisać co chcę w IPA. Mając długi fragment tekstu zapisany przy pomocy IPA, mogę każdy symbol IPA zamienić na swój łaciński skrót danego symbolu IPA. Czyli mam teraz długi fragment tekstu zapisany przy pomocy pseudo-IPA (mojego odwzorowania IPA jeden do jednego, przy pomocy tylko liter alfabetu łacińskiego, bez użycia symboli IPA). Mogę teraz zrobić procedurę odwrotną - każdy symbol pseudo-IPA zamienić na znaki IPA. I co otrzymam? Dokładnie to samo, co było na początku, ponieważ - jak już wspomniałem - odwzorowanie jest jeden do jednego. Żadnych informacji nie tracę, więc jednak jest to IPA, tylko zapisane w dziwny sposób, żeby uniknąć problemów z kodowaniem niestandardowych znaków w pliku tekstowym.
No a skąd wziąłem tszy zamiast trzy? Otóz sprawdziłem sobie na wikisłowniku (wikidictionary) jaki jest zapis IPA dla wyrazu trzy. Zapis ten składał się z trzech symboli IPA. Teraz użyłem swojego odwzorowania IPA, czyli każdy z tych trzech symboli zamieniłem na równoważny dla nich skrót jedno- lub dwuliterowy. Innymi słowy "sz" oznacza ten symbol IPA, który sobie akurat tak, a nie inaczej zapisałem (co można zobaczyć w pliku jpg, do którego link dałem na górze).
Co do ubezdźwięcznienia, to nie będę wnikał w to, kto zapisał "trzy" w taki, a nie inny sposób na wikisłowniku. Widocznie ten ktoś, kto zapewne był polonistą lub hobbystycznie zajmował się j. polskim, stwierdził, że jednak w języku mówionym nadspodziewanie często się to całe rz zmiękcza i wychodzi sz. Czy miał rację, czy nie, to tego już nie wiem. Próbuję sobie wymówić słowo "trzy" i jednak trochę sztucznie to brzmi, gdy próbuję na siłę "rz". Częściej wychodzi "sz". Tak jak wspomniałem, jest to bardziej pytanie, czy na wikisłowniku ktoś prawidłowo napisał wymowę słowa "trzy" przy pomocy IPA, a nie żadnych moich zabiegów.
No a problem pojawił się wtedy, gdy zdałem sobie sprawę, że bardzo niewiele wyrazów jest zapisanych przy pomocy IPA na wikisłowniku. Innymi słowy, mając zapis IPA dla tych wyrazów, dalej sobie samemu poradzę.
Z góry dzięki za pomoc,
pozdrawiam!
Post został pochwalony 0 razy
Ostatnio zmieniony przez johnyjj2 dnia Śro 4:18, 30 Gru 2009, w całości zmieniany 1 raz
|
|
Powrót do góry |
|
|
Karen
|
Wysłany: Śro 9:40, 30 Gru 2009 Temat postu: |
|
|
Dołączył: 14 Lut 2008
Posty: 225
Przeczytał: 0 tematów
Pomógł: 12 razy
|
Cóż, nie do końca rozumiem, w jaki sposób funkcjonuje kodowanie mowy, o którym tu mówisz. Mimo to upieram się, że Twoje "symbole" nie są International Phonetic Alphabet, ponieważ symbole te nie są takimi, jakie występują w IPA.
Ponadto, Twoje symbole mogą być niezrozumiałe dla użytkownika nie-Polaka lub nie-polonisty, więc nie spełniają podstawowego zadania, jakie ma IPA, a więc bycie dostępnym i zrozumiałym także dla uczących się języka.
Stworzyłeś własne przyporządkowanie głosek i symboli, na potrzeby pewnego oprogramowania. Nie nazywaj tego IPA.
Post został pochwalony 0 razy
|
|
Powrót do góry |
|
|
johnyjj2
|
Wysłany: Nie 16:18, 03 Sty 2010 Temat postu: |
|
|
Dołączył: 13 Lis 2009
Posty: 5
Przeczytał: 0 tematów
|
Koniec końców to żadna różnica jak nazwiemy to kodowanie, IPA czy nie IPA. Kwestia jest taka, że aby system działał potrzebuję znaleźć IPA dla tej grupy wyrazów, którą podałem na początku, a nigdzie znaleźć nie jestem w stanie. Wikisłownik nie posiada większości słów, a dostępu do biblioteki z filologii polskiej nie mam.
Pozdrawiam i szczęśliwego Nowego Roku !
Post został pochwalony 0 razy
|
|
Powrót do góry |
|
|
johnyjj2
|
Wysłany: Sob 15:41, 16 Sty 2010 Temat postu: |
|
|
Dołączył: 13 Lis 2009
Posty: 5
Przeczytał: 0 tematów
|
Witam!
Mogę poprosić pewną osobę, żeby mi znalazła taki słownik zawierający zapis IPA dla wszystkich słów w Bibliotece Śląskiej lub bibliotece Uniwersytetu Śląskiego. Rzecz w tym, że ta osoba prosi mnie o konkretny tytuł książki. Czy możesz, Karen, podać mi tytuł i autora słownika, w którym będę w stanie znaleźć zapis IPA dla tej listy słów ("pomoc nastepna szczegoly"...)? Te biblioteki zapewne mają elektroniczny katalog.
Pozdrawiam!
Post został pochwalony 0 razy
|
|
Powrót do góry |
|
|
|
|
|
|
Strona 1 z 1 |
|
Nie możesz pisać nowych tematów Nie możesz odpowiadać w tematach Nie możesz zmieniać swoich postów Nie możesz usuwać swoich postów Nie możesz głosować w ankietach
|
|
|
|