Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

aspell + eclipse + polskie znaki

117 views
Skip to first unread message

kbl

unread,
Oct 13, 2007, 7:34:13 PM10/13/07
to
Witam,
Używam Eclipsa z pluginem Texlipse do edytowania dokumentów
"texowych". Plugin ten ma możliwość sprawdzania pisowni dokumentu przy
pomocy aspell'a. Zainstalowałem, uaktualniłem słownik "kurnikową
wersją" (z tego co wiem kodowaną w iso-8859-2), próbuję sprawdzać.. no
i tu pojawia się problem -- większość wyrazów z polskimi literkami
uważanych jest za błędne mimo ich poprawnej pisowni.

Próbowałem następujących kombinacji:
1. kodowanie dokumentu w cp-1250; bez parametru --encoding dla aspella
2. kodowanie dokumentu w iso-8859-2; z --encoding=iso-8859-2

O ile błędy w pierwszym przypadku są dla mnie jasne, to drugi jest
prawdziwą zagadką.

Chciałem sprawdzić wszystko "na cp-1250", lecz niestety nie mogę na
aspellu "wymusić czytania" w cp-1250, ponieważ brakuje mi pliku z tym
kodowaniem (cp-1250.dat -- swego czasu był link na tej grupie.. teraz
niestety już martwy).

Sam widzę dwie możliwe przyczyny, ale nie jestem pewien żadnej z nich:
- "zgrzyt" na konsoli (z tego co wiem to w xp konsola kodowana jest w
cp-1250)
- "zgrzyt" przy czytaniu ze słownika (nie jestem pewien do końca jakie
jest kodowanie słownika kurnikowego)

Proszę poradźcie mi jak mogę rozwiązać mój problem..

--
Pozdrawiam
Marcin Pietraszek

Marcin Frankowski

unread,
Oct 14, 2007, 4:02:36 AM10/14/07
to
Sat, 13 Oct 2007 16:34:13 -0700, kbl <m.piet...@gmail.com>
napisał(a):

> Chciałem sprawdzić wszystko "na cp-1250", lecz niestety nie mogę na
> aspellu "wymusić czytania" w cp-1250, ponieważ brakuje mi pliku z tym
> kodowaniem (cp-1250.dat -- swego czasu był link na tej grupie.. teraz
> niestety już martwy).

Chodzi może o ten:
<http://konfiguracja.prv.pl/www/aspell_Windows-1250dat.zip>? Właśnie
sprawdziłem i działa.

--
Marcin Frankowski
mail: http://www.cerbermail.com/?GwMBsEhHr8 NIE w HTML!
Na kłopoty z konfiguracją OE i z polskimi literami w poczcie,
newsach i na www: http://konfiguracja.prv.pl/

Marcin Frankowski

unread,
Oct 14, 2007, 4:05:12 AM10/14/07
to
Sat, 13 Oct 2007 16:34:13 -0700, kbl <m.piet...@gmail.com>
napisał(a):

> Chciałem sprawdzić wszystko "na cp-1250", lecz niestety nie mogę na


> aspellu "wymusić czytania" w cp-1250, ponieważ brakuje mi pliku z tym
> kodowaniem (cp-1250.dat -- swego czasu był link na tej grupie.. teraz
> niestety już martwy).

Chodzi może o ten:

> - "zgrzyt" na konsoli (z tego co wiem to w xp konsola kodowana jest w
> cp-1250)

Konsola używa domyślnie kodowania CP852 (DOS), ale poleceniem CHCP
można ją przełączyć na inne, na przykład:
chcp 1250 - Windows-1250
chcp 28592 - ISO-8859-2
chcp 65001 - UTF-8

Działa tylko w trybie okienkowym.

> - "zgrzyt" przy czytaniu ze słownika (nie jestem pewien do końca jakie
> jest kodowanie słownika kurnikowego)

W ISO-8859-2

kbl

unread,
Oct 14, 2007, 9:10:45 AM10/14/07
to
Witam,

Pomińmy proszę, narazie, cp-1250 i odpowiedni plik do aspella (za
który nawiasem mówiąc dziękuję (: )..

Skoro słownik kurnikowy kodowany jest w iso-8859-2 i mój dokument w
eclipsie kodowany jest dokładnie w ten sam sposób i wreszcie apellowi
wskazuję plik z odpowiednim kodowaniem -- iso-8859-2 to dlaczego
grzecznie nie "łyka" polskich literek a wskazuje błędy?

Zauważyłem, że ma problem z ą i ś, ś traktuje jako znak, którego nie
sprawdza -- wyraz gość jest poprawny a np. czelność już nie
(podkreślone czelno).

--
Pozdrawiam
Marcin Pietraszek

Marcin Frankowski

unread,
Oct 14, 2007, 4:31:32 PM10/14/07
to
Sun, 14 Oct 2007 13:10:45 -0000, kbl <m.piet...@gmail.com>
napisał(a):

> Witam,
>
> Pomińmy proszę, narazie, cp-1250 i odpowiedni plik do aspella (za
> który nawiasem mówiąc dziękuję (: )..
>
> Skoro słownik kurnikowy kodowany jest w iso-8859-2 i mój dokument w
> eclipsie kodowany jest dokładnie w ten sam sposób i wreszcie apellowi
> wskazuję plik z odpowiednim kodowaniem -- iso-8859-2 to dlaczego
> grzecznie nie "łyka" polskich literek a wskazuje błędy?

Bo może jednak Twój dokument jest kodowany inaczej? Nie znam eclipse,
nigdy go nie używałem, ale czy na pewno koduje w ISO? Programy
pracujące pod Windows mimo wszystko najczęściej (ba, prawie zawsze)
kodują w Windows-1250, czasem w UTF-8, a ISO to bardzo rzadko, i
szczerze mówiąc nie spotkałem się z programem pod Windows (poza
edytorami www), który by natywnie i domyślnie używał kodowania
ISO-8859-2. Ja bym sprawdził kodowanie i upewnił się, że jest tak, jak
piszesz. Polski słownik do Aspella jest na 100% kodowany ISO-8859-2,
nawet specjalnie teraz otworzyłem plik słownika i sprawdziłem
kodowanie.

Nie mogę w sieci nic znaleźć na temat eclipse (tzn. znajduję wiele, ale
wygląda, że to nie ten eclipse), co dodatkowo utrudnia postawienie
diagnozy.

> Zauważyłem, że ma problem z ą i ś, ś traktuje jako znak, którego nie
> sprawdza -- wyraz gość jest poprawny a np. czelność już nie
> (podkreślone czelno).

Problemy z ą i ś (BTW nie zauważyłeś oprócz tego problemów z ź?)
wskazują, że masz problem z kodowaniem - ISO-8859-2 i Win-1250 różnią
się właśnie tymi trzema literami, jeżeli bierzemy pod uwagę tylko
polskie litery. Go jest poprawnym słowem w języku polskim (to nazwa
japońskiej gry planszowej, co na pewno sam wiesz), stąd przepuszcza
gość mimo ignorowania istnienia ś.

Może coś pomocnego znajdziesz na http://konfiguracja.prv.pl/www/ p.
2.2.3 podpunkt 2?

> --
> Pozdrawiam
> Marcin Pietraszek

Przy okazji duża prośba: popraw sobie delimiter na prawidłowy (minus,
minus, spacja).

Marcin ‘Qrczak’ Kowalczyk

unread,
Oct 14, 2007, 7:09:57 PM10/14/07
to
Dnia 15-10-2007, Pn o godzinie 09:31 +1300, Marcin Frankowski pisze:

> Go jest poprawnym słowem w języku polskim (to nazwa
> japońskiej gry planszowej, co na pewno sam wiesz),

Słowo "go" ma też o wiele bardziej popularne użycie :-)

--
__("< Marcin Kowalczyk
\__/ qrc...@knm.org.pl
^^ http://qrnik.knm.org.pl/~qrczak/

kbl

unread,
Oct 22, 2007, 5:12:11 PM10/22/07
to
Witam,

> > Skoro słownik kurnikowy kodowany jest w iso-8859-2 i mój dokument w
> > eclipsie kodowany jest dokładnie w ten sam sposób i wreszcie apellowi
> > wskazuję plik z odpowiednim kodowaniem -- iso-8859-2 to dlaczego
> > grzecznie nie "łyka" polskich literek a wskazuje błędy?
>
> Bo może jednak Twój dokument jest kodowany inaczej? Nie znam eclipse,
> nigdy go nie używałem, ale czy na pewno koduje w ISO?

Wydaje mi się, że możliwość zmiany kodowania w Eclipsie mogę traktować
jako wyznacznik - jest możliwość zmiany między cp-1250, iso, utf'ami i
pewnie całą masą innych kodowań (Window -> Preferences -> General ->
Workspace -> Text file encoding). Przyznam się bez bicia, że kodowania
w innym programie (jakim?) nie sprawdzałem.

> > Zauważyłem, że ma problem z ą i ś, ś traktuje jako znak, którego nie
> > sprawdza -- wyraz gość jest poprawny a np. czelność już nie
> > (podkreślone czelno).
>
> Problemy z ą i ś (BTW nie zauważyłeś oprócz tego problemów z ź?)

Możliwe, że błąd z "ź" też występuje, jednak z racji na rzadkie
występowanie tej literki nie zauważyłem (:

> Go jest poprawnym słowem w języku polskim (to nazwa
> japońskiej gry planszowej, co na pewno sam wiesz), stąd przepuszcza
> gość mimo ignorowania istnienia ś.

Heh.. z kurnika mam nie tylko słownik (; - trochę czasu przy Go na
kurniku spędziłem.

> Może coś pomocnego znajdziesz nahttp://konfiguracja.prv.pl/www/p.
> 2.2.3 podpunkt 2?
Niestety narzędzia tego typu raczej odpadają, z tego względu, że tekst
nadziany jest znacznikami texowymi co czyni go bardzo czerwonym (:.
Poza tym chciałem ominąć "proste" przeklejanie do Worda czy jemu
podobnych.

> Przy okazji duża prośba: popraw sobie delimiter na prawidłowy (minus,
> minus, spacja).

Z delimiterem już nie pierwszy raz jest ten sam problem.. zupełnie nie
wiem z jakiego powodu.. Sam, dla pewności, zawsze wklepuję "-- " i
zawsze jest to samo ):

--
Pozdrawiam
Marcin Pietraszek

Marcin Frankowski

unread,
Oct 23, 2007, 2:57:28 AM10/23/07
to
Mon, 22 Oct 2007 14:12:11 -0700, kbl <m.piet...@gmail.com>
napisał(a):

> Witam,
>
>>> Skoro słownik kurnikowy kodowany jest w iso-8859-2 i mój dokument w
>>> eclipsie kodowany jest dokładnie w ten sam sposób i wreszcie apellowi
>>> wskazuję plik z odpowiednim kodowaniem -- iso-8859-2 to dlaczego
>>> grzecznie nie "łyka" polskich literek a wskazuje błędy?
>> Bo może jednak Twój dokument jest kodowany inaczej? Nie znam eclipse,
>> nigdy go nie używałem, ale czy na pewno koduje w ISO?
> Wydaje mi się, że możliwość zmiany kodowania w Eclipsie mogę traktować
> jako wyznacznik - jest możliwość zmiany między cp-1250, iso, utf'ami i
> pewnie całą masą innych kodowań (Window -> Preferences -> General ->
> Workspace -> Text file encoding).

Znane mi są programy, które co prawda umożliwiają wybór kodowania
otwieranego i zapisywanego dokumentu, ale wewnętrznie używają tylko
jednego (przy otwieraniu konwertują ze wskazanego do swojego
wewnętrznego, a przy zapisywaniu konwertują ze swojego wewnętrznego na
wybrane). To oczywiście takie gdybanie, bo dopóki nie zobaczę treści
dokumentu tworzonego przez ten program, dopóty nie będę wiedział, jak
jest kodowany, a nie zobaczę, bo programu nie mam i mieć nie będę.

> Przyznam się bez bicia, że kodowania
> w innym programie (jakim?) nie sprawdzałem.

Np. UniRed.

>>> Zauważyłem, że ma problem z ą i ś, ś traktuje jako znak, którego nie
>>> sprawdza -- wyraz gość jest poprawny a np. czelność już nie
>>> (podkreślone czelno).
>> Problemy z ą i ś (BTW nie zauważyłeś oprócz tego problemów z ź?)
> Możliwe, że błąd z "ź" też występuje, jednak z racji na rzadkie
> występowanie tej literki nie zauważyłem (:

Aha. No to upewnię się: pozostałe polskie litery są poprawnie
interpretowane, a problem jest tylko z ą i ś (i ewentualnie z ź)? Jak
tak, to prawie na 100% masz problem z wyborem kodowania sprawdzanego
dokumentu. Ą, Ś, Ź, ą, ś i ź to są litery, których pozycje są różne
w ISO-8859-2 i w Windows-1250, pozostałe polskie litery są na tych
samych pozycjach w obu kodowaniach.

[...]


>> Może coś pomocnego znajdziesz nahttp://konfiguracja.prv.pl/www/p.
>> 2.2.3 podpunkt 2?
> Niestety narzędzia tego typu raczej odpadają, z tego względu, że tekst
> nadziany jest znacznikami texowymi co czyni go bardzo czerwonym (:.
> Poza tym chciałem ominąć "proste" przeklejanie do Worda czy jemu
> podobnych.

Chodziło mi raczej o linię z opcjami konfiguracyjnymi i ogólnie tekst
poświęcony Aspellowi - ja po prostu uzyskałem poprawną obsługę tekstów
kodowanych Windows-1250.

Ja na Twoim miejscu bym spróbował najpierw sprawdzić, czy na pewno
pstryczek informujący, że tekst jest kodowany Windows-1250, jest
poprawny i poprawnie wpisany w opcje konfiguracyjne. Jeżeli wspomniany
pstryczek nie jest poprawnie wpisany, to Aspell go zignoruje
i domyślnie zastosuje kodowanie słownika, czyli ISO-8859-2 (tak
przynajmniej mi się kołacze w pamięci).

>> Przy okazji duża prośba: popraw sobie delimiter na prawidłowy (minus,
>> minus, spacja).
> Z delimiterem już nie pierwszy raz jest ten sam problem.. zupełnie nie
> wiem z jakiego powodu.. Sam, dla pewności, zawsze wklepuję "-- " i
> zawsze jest to samo ):
>
> --
> Pozdrawiam
> Marcin Pietraszek

Niestety, znów coś Ci zjadło spację.

0 new messages