Integration Basisextraktoren

8 views
Skip to first unread message

Stefan Schramm

unread,
Feb 15, 2011, 12:43:47 PM2/15/11
to goolap-e...@googlegroups.com
Hi,

weil ich mir nicht anders zu helfen wusste, habe ich jetzt die
Basisextraktoren doch als Modul in enjoy-rep/ abgelegt (statt es als
Jar-Dependency einzubinden). Ich hoffe das Compilieren klappt noch bei
allen.
Max: Das Hochladen des enjoy-baseextractors.jar hat sich damit er�brigt.

Au�erdem dependet jetzt enjoy-data on enjoy-baseextractors.
Ich habe enjoy-baseextractors jetzt _nicht_ in enjoy-dist als Dependency
eingetragen, weil enjoy-data dort bereits enthalten ist und ich jetzt
mal davon ausgehe, dass das dann von selbst transitiv ist.

Die Schnittstelle selbst ist in enjoy-data/.../BaseExtractors.java und
es gibt einen zugeh�rigen Test, der die Basisannotatoren mit einem
Testsatz startet.

Es werden momentan folgende UIMA-Annotatoren via BaseAggregate.xml
ausgef�hrt: StanfordPOS, CDGroup, Metrik, Curreny, Address, StanfordNER


Stefan


--
Stefan Schramm | Schliemannstr. 3 | 10437 Berlin
Tel.: +49 30 20236399 | Mobil: +49 163 7736399
Skype: stefanschramm | XMPP: stefan...@jabber.ccc.de

Max Heimel

unread,
Feb 22, 2011, 6:19:34 AM2/22/11
to goolap-e...@googlegroups.com
Hey Stefan,

erstmal danke. Das sieht schon sehr gut aus. Ich habe momentan aber noch Probleme das ganze zu kompilieren. Maven hängt sich mit folgendem Fehler auf:

[ERROR] Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:2.3.2:compile (default-compile) on project enjoy-baseextractors: Compilation failure: Compilation failure:
[ERROR] /home/mheimel/workspace/enjoy-rep/enjoy-baseextractors/src/main/java/info/goolap/extraction/stanford/ner/StanfordNERAnnotator.java:[85,50] type parameters of <VALUE>VALUE cannot be determined; no unique maximal instance exists for type variable VALUE with upper bounds int,java.lang.Object
[ERROR] /home/mheimel/workspace/enjoy-rep/enjoy-baseextractors/src/main/java/info/goolap/extraction/stanford/ner/StanfordNERAnnotator.java:[89,50] type parameters of <VALUE>VALUE cannot be determined; no unique maximal instance exists for type variable VALUE with upper bounds int,java.lang.Object
[ERROR] /home/mheimel/workspace/enjoy-rep/enjoy-baseextractors/src/main/java/info/goolap/extraction/stanford/ner/StanfordNERAnnotator.java:[92,40] type parameters of <VALUE>VALUE cannot be determined; no unique maximal instance exists for type variable VALUE with upper bounds int,java.lang.Object

Irgendwelche Ideen? 

2011/2/15 Stefan Schramm <ma...@stefanschramm.net>
Hi,

weil ich mir nicht anders zu helfen wusste, habe ich jetzt die
Basisextraktoren doch als Modul in enjoy-rep/ abgelegt (statt es als
Jar-Dependency einzubinden). Ich hoffe das Compilieren klappt noch bei
allen.
Max: Das Hochladen des enjoy-baseextractors.jar hat sich damit erübrigt.

Außerdem dependet jetzt enjoy-data on enjoy-baseextractors.

Ich habe enjoy-baseextractors jetzt _nicht_ in enjoy-dist als Dependency
eingetragen, weil enjoy-data dort bereits enthalten ist und ich jetzt
mal davon ausgehe, dass das dann von selbst transitiv ist.

Die Schnittstelle selbst ist in enjoy-data/.../BaseExtractors.java und
es gibt einen zugehörigen Test, der die Basisannotatoren mit einem

Testsatz startet.

Es werden momentan folgende UIMA-Annotatoren via BaseAggregate.xml
ausgeführt: StanfordPOS, CDGroup, Metrik, Curreny, Address, StanfordNER



Stefan


--
Stefan Schramm | Schliemannstr. 3 | 10437 Berlin
Tel.: +49 30 20236399 | Mobil: +49 163 7736399
Skype: stefanschramm | XMPP: stefan...@jabber.ccc.de

--
Sie erhalten diese Nachricht, weil Sie Mitglied sind von Google
Groups-Gruppe "GOOLAP ENJOY Team".
Für das Erstellen von Beiträgen in dieser Gruppe senden Sie eine E-Mail
an goolap-e...@googlegroups.com
Um sich von dieser Gruppe abzumelden, senden Sie eine E-Mail an
goolap-enjoy-t...@googlegroups.com
Weitere Optionen finden Sie in dieser Gruppe unter
http://groups.google.com/group/goolap-enjoy-team?hl=de?hl=de

Stefan Schramm

unread,
Feb 22, 2011, 7:24:21 AM2/22/11
to goolap-e...@googlegroups.com
Hi,

komisch, trat/tritt bei mir nicht auf (Debian Maven 2.2.1, Java
1.6.0_22). Dem Log nach hast du es aber anscheinend schon gefixt?

Ich habe gerade noch BaseExtractors.java korrigiert, dass er das
"fulltext" statt "text" Attribut benutzt.


Gr��e
Stefan

On 02/22/2011 12:19 PM, Max Heimel wrote:
> [...]


> /home/mheimel/workspace/enjoy-rep/enjoy-baseextractors/src/main/java/info/goolap/extraction/stanford/ner/StanfordNERAnnotator.java:[89,50]
> type parameters of <VALUE>VALUE cannot be determined; no unique maximal
> instance exists for type variable VALUE with upper bounds
> int,java.lang.Object

> [...]

mhe...@googlemail.com

unread,
Feb 22, 2011, 8:01:55 AM2/22/11
to goolap-e...@googlegroups.com
Ok,

Ich habe gerade noch ein wenig refactored um die Komoponenten schöner zu trennen.
enjoy-data ist jetzt nur die Datenbeschaffung, enjoy-align alles was mit dem annotieren der Daten zu tun hat, enjoy-baseextractors alles was mit der UIMA pipeline zu tun hat

Dh: Cas2JsonConverter ist jetzt unter enjoy-basextractor im util packacge
BaseExtractors.java + Test sind jetzt unter enjoy-align

Kannst du bitte noch den Json2CasConverter in enjoy-baseextractor hinzufügen? Felix benötigt den unter Umständen.

Danke
Max

Stefan Schramm

unread,
Feb 22, 2011, 8:40:06 AM2/22/11
to goolap-e...@googlegroups.com
Hi,

On 02/22/2011 02:01 PM, mhe...@googlemail.com wrote:
> Kannst du bitte noch den Json2CasConverter in enjoy-baseextractor

> hinzuf�gen? Felix ben�tigt den unter Umst�nden.

OK, ist drin. Musste einige Anpassungen machen, damit es kompiliert
(siehe Anhang) - JsonRecord-API hatte sich wohl ver�ndert.
Funktionsf�higkeit ist noch nicht getestet!


Stefan

Json2CasConverter.java.diff
Reply all
Reply to author
Forward
0 new messages