Bearbeitet von derbenutzer, 16 Oktober 2012 - 21:03.
Software für rudimentäres Text-Mining gesucht
Erstellt von
derbenutzer
, Okt 16 2012 18:53
4 Antworten in diesem Thema
#1
Geschrieben 16 Oktober 2012 - 18:53
Geschätzte Gemeinschaft!
Kennt bitte jemand von Euch eine Software, die Dinge wie folgt beherrscht:
Mächtigkeit des Wortschatzes, sprich: wie viele unterschiedliche Wörter hat der Text (Wortformen berücksichtigend)?
Durchschnittliche Satzlänge?
Hervorhebung von Wortwiederholungen?
Statistische Auswertung der verwendeten Wörter (z.B. wie viele Hauptwörter, Eigenschaftswörter etc.)?
Ich weiß, da gibt es professionelle Pakete, einiges von den obigen Features würde aber auch schon reichen.
Vielen Dank im Voraus!
Jakob
Austriae Est Imperare Orbi Universo
#2
Geschrieben 16 Oktober 2012 - 19:54
Interessante Frage. Hätte ich auch gerne
Das einzige, von dem ich weiß, dass ein wenig in die Richtung geht, ist Papyrus Autor, das ja eine Stilanalyse anhand von Andreas Eschbachs 10-Punkte-Text-ÜV bietet. (Die ich bei meinen eigenen Texten übrigens auch immer - allerdings manuell - einsetze.)
Das einzige, von dem ich weiß, dass ein wenig in die Richtung geht, ist Papyrus Autor, das ja eine Stilanalyse anhand von Andreas Eschbachs 10-Punkte-Text-ÜV bietet. (Die ich bei meinen eigenen Texten übrigens auch immer - allerdings manuell - einsetze.)
Biom Alpha ist im Sonnensystem angekommen. Jetzt auf eigener Seite und auf Twitter @BiomAlpha
#3
Geschrieben 16 Oktober 2012 - 20:10
Ich kenne TextQuest, aktuell 4.1, mehr unter www.textquest.de.
My.
#4
Geschrieben 18 Oktober 2012 - 13:47
Durchschnittliche Satzlänge kriegt man schon mit Word raus: Wörter zählen, Zahl der Wörter durch die der Sätze teilen. Auf die Art habe ich herausgefunden, dass ein Wort irgendwas um 6.3 Buchstaben hat bei mir ...
- • (Buch) gerade am lesen:Gene Wolfe "Sword and Citadel"
#5
Geschrieben 18 Oktober 2012 - 15:51
Danke an alle!
Papyrus Autor geht schon etwas in die Richtung. TextQuest vermutlich noch mehr.
@Heidrun
LG
Jakob
Papyrus Autor geht schon etwas in die Richtung. TextQuest vermutlich noch mehr.
@Heidrun
Die Tücken der Statistik ...[...] Auf die Art habe ich herausgefunden, dass ein Wort irgendwas um 6.3 Buchstaben hat bei mir ...
LG
Jakob
Austriae Est Imperare Orbi Universo
Besucher die dieses Thema lesen: 0
Mitglieder: 0, Gäste: 0, unsichtbare Mitglieder: 0