Próbowałem następujących kombinacji:
1. kodowanie dokumentu w cp-1250; bez parametru --encoding dla aspella
2. kodowanie dokumentu w iso-8859-2; z --encoding=iso-8859-2
O ile błędy w pierwszym przypadku są dla mnie jasne, to drugi jest
prawdziwą zagadką.
Chciałem sprawdzić wszystko "na cp-1250", lecz niestety nie mogę na
aspellu "wymusić czytania" w cp-1250, ponieważ brakuje mi pliku z tym
kodowaniem (cp-1250.dat -- swego czasu był link na tej grupie.. teraz
niestety już martwy).
Sam widzę dwie możliwe przyczyny, ale nie jestem pewien żadnej z nich:
- "zgrzyt" na konsoli (z tego co wiem to w xp konsola kodowana jest w
cp-1250)
- "zgrzyt" przy czytaniu ze słownika (nie jestem pewien do końca jakie
jest kodowanie słownika kurnikowego)
Proszę poradźcie mi jak mogę rozwiązać mój problem..
--
Pozdrawiam
Marcin Pietraszek
> Chciałem sprawdzić wszystko "na cp-1250", lecz niestety nie mogę na
> aspellu "wymusić czytania" w cp-1250, ponieważ brakuje mi pliku z tym
> kodowaniem (cp-1250.dat -- swego czasu był link na tej grupie.. teraz
> niestety już martwy).
Chodzi może o ten:
<http://konfiguracja.prv.pl/www/aspell_Windows-1250dat.zip>? Właśnie
sprawdziłem i działa.
--
Marcin Frankowski
mail: http://www.cerbermail.com/?GwMBsEhHr8 NIE w HTML!
Na kłopoty z konfiguracją OE i z polskimi literami w poczcie,
newsach i na www: http://konfiguracja.prv.pl/
> Chciałem sprawdzić wszystko "na cp-1250", lecz niestety nie mogę na
> aspellu "wymusić czytania" w cp-1250, ponieważ brakuje mi pliku z tym
> kodowaniem (cp-1250.dat -- swego czasu był link na tej grupie.. teraz
> niestety już martwy).
Chodzi może o ten:
<http://konfiguracja.prv.pl/www/aspell_Windows-1250dat.zip>? Właśnie
sprawdziłem i działa.
> - "zgrzyt" na konsoli (z tego co wiem to w xp konsola kodowana jest w
> cp-1250)
Konsola używa domyślnie kodowania CP852 (DOS), ale poleceniem CHCP
można ją przełączyć na inne, na przykład:
chcp 1250 - Windows-1250
chcp 28592 - ISO-8859-2
chcp 65001 - UTF-8
Działa tylko w trybie okienkowym.
> - "zgrzyt" przy czytaniu ze słownika (nie jestem pewien do końca jakie
> jest kodowanie słownika kurnikowego)
W ISO-8859-2
Pomińmy proszę, narazie, cp-1250 i odpowiedni plik do aspella (za
który nawiasem mówiąc dziękuję (: )..
Skoro słownik kurnikowy kodowany jest w iso-8859-2 i mój dokument w
eclipsie kodowany jest dokładnie w ten sam sposób i wreszcie apellowi
wskazuję plik z odpowiednim kodowaniem -- iso-8859-2 to dlaczego
grzecznie nie "łyka" polskich literek a wskazuje błędy?
Zauważyłem, że ma problem z ą i ś, ś traktuje jako znak, którego nie
sprawdza -- wyraz gość jest poprawny a np. czelność już nie
(podkreślone czelno).
--
Pozdrawiam
Marcin Pietraszek
> Witam,
>
> Pomińmy proszę, narazie, cp-1250 i odpowiedni plik do aspella (za
> który nawiasem mówiąc dziękuję (: )..
>
> Skoro słownik kurnikowy kodowany jest w iso-8859-2 i mój dokument w
> eclipsie kodowany jest dokładnie w ten sam sposób i wreszcie apellowi
> wskazuję plik z odpowiednim kodowaniem -- iso-8859-2 to dlaczego
> grzecznie nie "łyka" polskich literek a wskazuje błędy?
Bo może jednak Twój dokument jest kodowany inaczej? Nie znam eclipse,
nigdy go nie używałem, ale czy na pewno koduje w ISO? Programy
pracujące pod Windows mimo wszystko najczęściej (ba, prawie zawsze)
kodują w Windows-1250, czasem w UTF-8, a ISO to bardzo rzadko, i
szczerze mówiąc nie spotkałem się z programem pod Windows (poza
edytorami www), który by natywnie i domyślnie używał kodowania
ISO-8859-2. Ja bym sprawdził kodowanie i upewnił się, że jest tak, jak
piszesz. Polski słownik do Aspella jest na 100% kodowany ISO-8859-2,
nawet specjalnie teraz otworzyłem plik słownika i sprawdziłem
kodowanie.
Nie mogę w sieci nic znaleźć na temat eclipse (tzn. znajduję wiele, ale
wygląda, że to nie ten eclipse), co dodatkowo utrudnia postawienie
diagnozy.
> Zauważyłem, że ma problem z ą i ś, ś traktuje jako znak, którego nie
> sprawdza -- wyraz gość jest poprawny a np. czelność już nie
> (podkreślone czelno).
Problemy z ą i ś (BTW nie zauważyłeś oprócz tego problemów z ź?)
wskazują, że masz problem z kodowaniem - ISO-8859-2 i Win-1250 różnią
się właśnie tymi trzema literami, jeżeli bierzemy pod uwagę tylko
polskie litery. Go jest poprawnym słowem w języku polskim (to nazwa
japońskiej gry planszowej, co na pewno sam wiesz), stąd przepuszcza
gość mimo ignorowania istnienia ś.
Może coś pomocnego znajdziesz na http://konfiguracja.prv.pl/www/ p.
2.2.3 podpunkt 2?
> --
> Pozdrawiam
> Marcin Pietraszek
Przy okazji duża prośba: popraw sobie delimiter na prawidłowy (minus,
minus, spacja).
> Go jest poprawnym słowem w języku polskim (to nazwa
> japońskiej gry planszowej, co na pewno sam wiesz),
Słowo "go" ma też o wiele bardziej popularne użycie :-)
--
__("< Marcin Kowalczyk
\__/ qrc...@knm.org.pl
^^ http://qrnik.knm.org.pl/~qrczak/
> > Skoro słownik kurnikowy kodowany jest w iso-8859-2 i mój dokument w
> > eclipsie kodowany jest dokładnie w ten sam sposób i wreszcie apellowi
> > wskazuję plik z odpowiednim kodowaniem -- iso-8859-2 to dlaczego
> > grzecznie nie "łyka" polskich literek a wskazuje błędy?
>
> Bo może jednak Twój dokument jest kodowany inaczej? Nie znam eclipse,
> nigdy go nie używałem, ale czy na pewno koduje w ISO?
Wydaje mi się, że możliwość zmiany kodowania w Eclipsie mogę traktować
jako wyznacznik - jest możliwość zmiany między cp-1250, iso, utf'ami i
pewnie całą masą innych kodowań (Window -> Preferences -> General ->
Workspace -> Text file encoding). Przyznam się bez bicia, że kodowania
w innym programie (jakim?) nie sprawdzałem.
> > Zauważyłem, że ma problem z ą i ś, ś traktuje jako znak, którego nie
> > sprawdza -- wyraz gość jest poprawny a np. czelność już nie
> > (podkreślone czelno).
>
> Problemy z ą i ś (BTW nie zauważyłeś oprócz tego problemów z ź?)
Możliwe, że błąd z "ź" też występuje, jednak z racji na rzadkie
występowanie tej literki nie zauważyłem (:
> Go jest poprawnym słowem w języku polskim (to nazwa
> japońskiej gry planszowej, co na pewno sam wiesz), stąd przepuszcza
> gość mimo ignorowania istnienia ś.
Heh.. z kurnika mam nie tylko słownik (; - trochę czasu przy Go na
kurniku spędziłem.
> Może coś pomocnego znajdziesz nahttp://konfiguracja.prv.pl/www/p.
> 2.2.3 podpunkt 2?
Niestety narzędzia tego typu raczej odpadają, z tego względu, że tekst
nadziany jest znacznikami texowymi co czyni go bardzo czerwonym (:.
Poza tym chciałem ominąć "proste" przeklejanie do Worda czy jemu
podobnych.
> Przy okazji duża prośba: popraw sobie delimiter na prawidłowy (minus,
> minus, spacja).
Z delimiterem już nie pierwszy raz jest ten sam problem.. zupełnie nie
wiem z jakiego powodu.. Sam, dla pewności, zawsze wklepuję "-- " i
zawsze jest to samo ):
--
Pozdrawiam
Marcin Pietraszek
> Witam,
>
>>> Skoro słownik kurnikowy kodowany jest w iso-8859-2 i mój dokument w
>>> eclipsie kodowany jest dokładnie w ten sam sposób i wreszcie apellowi
>>> wskazuję plik z odpowiednim kodowaniem -- iso-8859-2 to dlaczego
>>> grzecznie nie "łyka" polskich literek a wskazuje błędy?
>> Bo może jednak Twój dokument jest kodowany inaczej? Nie znam eclipse,
>> nigdy go nie używałem, ale czy na pewno koduje w ISO?
> Wydaje mi się, że możliwość zmiany kodowania w Eclipsie mogę traktować
> jako wyznacznik - jest możliwość zmiany między cp-1250, iso, utf'ami i
> pewnie całą masą innych kodowań (Window -> Preferences -> General ->
> Workspace -> Text file encoding).
Znane mi są programy, które co prawda umożliwiają wybór kodowania
otwieranego i zapisywanego dokumentu, ale wewnętrznie używają tylko
jednego (przy otwieraniu konwertują ze wskazanego do swojego
wewnętrznego, a przy zapisywaniu konwertują ze swojego wewnętrznego na
wybrane). To oczywiście takie gdybanie, bo dopóki nie zobaczę treści
dokumentu tworzonego przez ten program, dopóty nie będę wiedział, jak
jest kodowany, a nie zobaczę, bo programu nie mam i mieć nie będę.
> Przyznam się bez bicia, że kodowania
> w innym programie (jakim?) nie sprawdzałem.
Np. UniRed.
>>> Zauważyłem, że ma problem z ą i ś, ś traktuje jako znak, którego nie
>>> sprawdza -- wyraz gość jest poprawny a np. czelność już nie
>>> (podkreślone czelno).
>> Problemy z ą i ś (BTW nie zauważyłeś oprócz tego problemów z ź?)
> Możliwe, że błąd z "ź" też występuje, jednak z racji na rzadkie
> występowanie tej literki nie zauważyłem (:
Aha. No to upewnię się: pozostałe polskie litery są poprawnie
interpretowane, a problem jest tylko z ą i ś (i ewentualnie z ź)? Jak
tak, to prawie na 100% masz problem z wyborem kodowania sprawdzanego
dokumentu. Ą, Ś, Ź, ą, ś i ź to są litery, których pozycje są różne
w ISO-8859-2 i w Windows-1250, pozostałe polskie litery są na tych
samych pozycjach w obu kodowaniach.
[...]
>> Może coś pomocnego znajdziesz nahttp://konfiguracja.prv.pl/www/p.
>> 2.2.3 podpunkt 2?
> Niestety narzędzia tego typu raczej odpadają, z tego względu, że tekst
> nadziany jest znacznikami texowymi co czyni go bardzo czerwonym (:.
> Poza tym chciałem ominąć "proste" przeklejanie do Worda czy jemu
> podobnych.
Chodziło mi raczej o linię z opcjami konfiguracyjnymi i ogólnie tekst
poświęcony Aspellowi - ja po prostu uzyskałem poprawną obsługę tekstów
kodowanych Windows-1250.
Ja na Twoim miejscu bym spróbował najpierw sprawdzić, czy na pewno
pstryczek informujący, że tekst jest kodowany Windows-1250, jest
poprawny i poprawnie wpisany w opcje konfiguracyjne. Jeżeli wspomniany
pstryczek nie jest poprawnie wpisany, to Aspell go zignoruje
i domyślnie zastosuje kodowanie słownika, czyli ISO-8859-2 (tak
przynajmniej mi się kołacze w pamięci).
>> Przy okazji duża prośba: popraw sobie delimiter na prawidłowy (minus,
>> minus, spacja).
> Z delimiterem już nie pierwszy raz jest ten sam problem.. zupełnie nie
> wiem z jakiego powodu.. Sam, dla pewności, zawsze wklepuję "-- " i
> zawsze jest to samo ):
>
> --
> Pozdrawiam
> Marcin Pietraszek
Niestety, znów coś Ci zjadło spację.