Re: MetrikAggregate aufräumen

1 view
Skip to first unread message

Stefan Schramm

unread,
Jan 20, 2011, 9:35:12 AM1/20/11
to Oleg Mayevskiy, Max Heimel, goolap-e...@googlegroups.com
Hi Oleg und ENJOY-Liste (ganz unten, was auch andere betrifft),

On 01/20/2011 02:29 PM, Oleg Mayevskiy wrote:
> @Stefan Ich gehe gerade durch deine xml Dateien. Folgedes R�ume ich
> direkt auf:

�nderst du das direkt im bisherigen Repository (also
https://svn.dima.tu-berlin.de/svn/da-projekt-cloudbi/JOYLanguage/JOYAnalyzer)?

> M3Aggregate -> MetricsAggregate

Das k�nnte irritieren, wenn es gibt schon
desc/metrik/MetrikAggregate.xml, wo CurrencyAnnotator und
MetrikAnnotator enthalten sind. Bei M3Aggregate kam sozusagen RegexDate
dazu.

Wenn du Date sowieso bereits in der Pipeline hast, kannst du vielleicht
auch direkt desc/MetrikAggregate.xml benutzen.

> date: POS***.xml und Qualified***.xml wurden nie benutzt -> gel�scht
> date habe ich in meiner pipe bereits enthalten, f�r date solltest du
> die aktuellen sourcen aus meinem projekt nehmen, wenn dein aggregate
> auch date enthalten soll
> https://svn.dima.tu-berlin.de/svnExt/da-projekt-cloudbi/JOYLanguage/EnjoyProductionExtractor/Extractor-jar/src/main/java/info/goolap/extraction/date

Migrierst du das dann eigentlich auch in Max' neues Maven-Projekt, oder
soll das nicht f�r das Enjoy-Viewer-WebUI benutzt werden?

Die Deskriptor-Dateien, die ich dir geschickt hatte waren erstmal alle,
die es gab und daher unn�tig viele. (Hatte nicht weiter geguckt, was
SentenceCandidate und StanfordPOS brauchen.)

> joy: puh, als erstes f�llt auf: warum brauchen wir den JOYDescriptor
> und JOYTypesystem?

Werden nicht gebraucht f�r Metriken.

> joy.ner

Werden f�r Metriken auch nicht gebraucht.

> stanford: sollte eigentlich auch eigenst�ndig und ausgelagert sein.

StanfordPOS und die zugeh�rigen Types werden von Metrik und
SentenceCandidate benutzt (CD finden usw.). Aber auslagern w�re wohl
trotzdem sinnvoll.

Ich z�ger momentan das ganze umzustellen, weil ich nicht ausreichend
�berblick habe und nicht wei�, wer gerade noch dran arbeitet. Es w�re
schlecht, wenn es pl�tzlich zwei Repositories gibt und parallel
auseinander-gearbeitet wird. W�re eine Aufteilung in die folgenden
einzelne Maven-Artifacts sinnvoll?

enjoy-extraction-address
enjoy-extraction-date
enjoy-extraction-metrics
enjoy-extraction-sentencecandidate
enjoy-extraction-stanford-pos
enjoy-extraction-stanford-ner

Das waren jetzt die Teilprojekte, die ich kenne/ausmachen konnte.
Mindestens Generic Relations fehlt wohl noch. Und vermutlich sollte auch
Complex Location einzeln sein und aus Stanford-NER rausgenommen werden.


Stefan

--
Stefan Schramm | Schliemannstr. 3 | 10437 Berlin
Tel.: +49 30 20236399 | Mobil: +49 163 7736399
Skype: stefanschramm | XMPP: stefan...@jabber.ccc.de

Oleg Mayevskiy

unread,
Jan 20, 2011, 11:31:38 AM1/20/11
to Stefan Schramm, Max Heimel, goolap-e...@googlegroups.com
Am 20.01.2011 15:35, schrieb Stefan Schramm:
> Hi Oleg und ENJOY-Liste (ganz unten, was auch andere betrifft),
>
> On 01/20/2011 02:29 PM, Oleg Mayevskiy wrote:
>> @Stefan Ich gehe gerade durch deine xml Dateien. Folgedes R�ume ich
>> direkt auf:
> �nderst du das direkt im bisherigen Repository (also
> https://svn.dima.tu-berlin.de/svn/da-projekt-cloudbi/JOYLanguage/JOYAnalyzer)?
>
Nein.
So lange es sich um .jars und keine Maven Artefakte handelt, bleibt mir
nichts anderes �brig als alles h�ndig anzupassen, so dass es in meiner
Pipe lauff�hig ist.

>> M3Aggregate -> MetricsAggregate
> Das k�nnte irritieren, wenn es gibt schon
> desc/metrik/MetrikAggregate.xml, wo CurrencyAnnotator und
> MetrikAnnotator enthalten sind. Bei M3Aggregate kam sozusagen RegexDate
> dazu.
>
> Wenn du Date sowieso bereits in der Pipeline hast, kannst du vielleicht
> auch direkt desc/MetrikAggregate.xml benutzen.
Ok, M3Aggregate ist aber auch nichts sagend. Dann m�sste ein anderer
Name her. Ok, ich nehme dann nur den MetrikAggregate.

>> date: POS***.xml und Qualified***.xml wurden nie benutzt -> gel�scht
>> date habe ich in meiner pipe bereits enthalten, f�r date solltest du
>> die aktuellen sourcen aus meinem projekt nehmen, wenn dein aggregate
>> auch date enthalten soll
>> https://svn.dima.tu-berlin.de/svnExt/da-projekt-cloudbi/JOYLanguage/EnjoyProductionExtractor/Extractor-jar/src/main/java/info/goolap/extraction/date
> Migrierst du das dann eigentlich auch in Max' neues Maven-Projekt, oder
> soll das nicht f�r das Enjoy-Viewer-WebUI benutzt werden?
in Max rep: nein.
Ob es in gui benutzt werden muss: ja
Bitte erstmal nicht, das muss gut �berlegt werden. Wenn Max mehr �ber
automatisches Releasen herausgefunden hat, kann das sicherlich
vorangebracht werden.

In der Theorie ist danach beim releasen nur noch ein "mvn do release
now" Befehl notwendig.
Und f�rs Benutzen ein Eintrag in den Dependecies.

Derzeit muss ich das ganze noch von Hand auseinandernehmen und es gibt
keine Alternative daf�r.

Gr��e

Oleg.

Oleg Mayevskiy

unread,
Jan 20, 2011, 11:39:33 AM1/20/11
to Stefan Schramm, goolap-e...@googlegroups.com
Danke.

zur Info was ich damit gemacht habe:

Ich habe es in unserer nexus maven repository hochgeladen.

Wiederfinden kann man es hier:
http://goolap.info:8081/nexus/content/repositories/goolap-releases/info/goolap/metrics/1.0/

Folgende Abh�ngigkeit reicht nun aus:

<dependency>
<groupId>info.goolap</groupId>
<artifactId>metrics</artifactId>
<version>1.0</version>
</dependency>

um alle Klassen aus der jar zu benutzen.
und um sourcen und javadoc anzusehen.

mvn dependency:sources

O.


Am 20.01.2011 15:47, schrieb Stefan Schramm:
> Hi,
>
> hier sind nochmal die Jars.
>
>
> Stefan
>
> On 01/20/2011 01:51 PM, Oleg Mayevskiy wrote:
>> mvn source:jar
>> mvn javadoc:jar

Reply all
Reply to author
Forward
0 new messages