Zum Inhalt wechseln


Foto

Datenanalyse zum Vorhersagen von Ereignissen


  • Bitte melde dich an um zu Antworten
21 Antworten in diesem Thema

#1 Seti

Seti

    Zeitreisebegleiter durch die Windener Höhlen

  • Mitglieder
  • PIPPIPPIPPIPPIP
  • 1.957 Beiträge
  • Geschlecht:männlich

Geschrieben 09 Februar 2012 - 20:40

Hallo zusammen,

ich hab ja schon einige Male anklingen lassen, dass ich äußerst gern William Gibsons Bücher lese. Nun habe ich vor kurzem die Idoru-Trilogie beendet und seitdem geistert mir - bedingt durch die Figur des Netzläufers Colin Laney - ein Gedanke durch den Kopf:

Kann quantitative Datenanalyse zur gezielten Vorhersage von bestimmten Ereignissen eingesetzt werden? Wird sie das vielleicht sogar schon? Und welche Folgen hat das bzw. kann das haben?

Um mal ein Beispiel zu nennen (es geht dabei auch weniger um den konkreten Sachverhalt, sondern um eine Verdeutlichung meiner These):

Bevor es in den nordafrikanischen Staaten zum Arabischen Frühling kam, hätte man im arabischen Raum bestimmt (geeignete Analysetools vorausgesetzt) eine nicht unerhebliche Anzahl an Tweets, Facebook-Postings, Youtube-Clips, Blogs etc. feststellen können, welche bspw. Worte wie Freiheit und Demokratie, aber auch Unterdrückung und Diktatur enthielten. Und noch bevor es wirklich zu einer Revolution in Tunesien kam und diese dann auf Ägypten, Libyen, Syrien usw. übergriff, müsste man sogar einen signifikanten Anstieg solcher Botschaften registriert haben. Natürlich waren diese Botschaften nicht der Auslöser der Proteste, aber ich vermute, dass ihr Anstieg - als Reaktion auf auslösende Faktoren - den Protesten vorausging. Wenn dem so war, dann hätte man allein anhand der Analyse dieser Datenströme eigentlich voraussagen können, dass sich Teile Nordafrikas radikal wandeln werden. Und mit einer regionalen Eingrenzung der Uploads und Aufrufe solcher Botschaften, hätte man konzentrierte Knotenpunkte finden können, die möglicherweise sogar zu Hochburgen des Widerstands wurden. Und das wiederum hätte dazu führen können, dass man diesen Entwicklungen konsequent (militärisch) entgegensteuert...

Mich würde interessieren, was ihr von meiner These haltet - wie gesagt, geht es mir nicht primär um eine Diskussion über den Arabischen Frühling, sondern um die Ereignisvorhersage mithilfe von Daten...

Seti

"What today's nationalists and neosegregationists fail to understand," Kwame said, "is that the basis of every human culture is, and always has been, synthesis. No civilization is authentic, monolithic, pure; the exact opposite is true. Look at your average Western nation: its numbers Arabic, its alphabet Latin, its religion Levantine, its philosophy Greek†¦ need I continue? And each of these examples can itself be broken down further: the Romans got their alphabet from the Greeks, who created theirs by stealing from the Phoenicians, and so on. Our myths and religions, too, are syncretic - sharing, repeating and adapting a large variety of elements to suit their needs. Even the language of our creation, the DNA itself, is impure, defined by a history of amalgamation: not only between nations, but even between different human species!"

- The Talos Principle


#2 Jakob

Jakob

    Temponaut

  • Mitglieder
  • PIPPIPPIPPIPPIP
  • 1.979 Beiträge
  • Geschlecht:männlich
  • Wohnort:Berlin

Geschrieben 09 Februar 2012 - 21:35

Natürlich waren diese Botschaften nicht der Auslöser der Proteste, aber ich vermute, dass ihr Anstieg - als Reaktion auf auslösende Faktoren - den Protesten vorausging. Wenn dem so war, dann hätte man allein anhand der Analyse dieser Datenströme eigentlich voraussagen können, dass sich Teile Nordafrikas radikal wandeln werden.


Ich meine, da steckt ein Denkfehler drin: Wenn du meinst, dass die Botschaften nicht Auslöser waren ihr Anstieg aber den Protesten vorausging, hast du erst mal nur eine Korrelation, bei der es dann ohne Kenntnis der unterstellten gemeinsamen Ursache ziemlich schwierig wird, aus dem Anstieg eines Faktors auch den eines anderen abzuleiten. Und dabei weißt du dann noch nicht mal, ob es überhaupt eine gemeinsame Ursache gibt. Solange nicht klar ist, ob es eine direkte kausale Abhängigkeit gibt, sehe ich da nicht viel Vorhersagepotential ...
Allgemein halte ich solche Orakelei bei gesellschaftlichen Prozessen für ziemlichen Unsinn. Auch in der zeitgenössischen Wirtschaftswelt taugen die Vorhersagen ja ziemlich wenig. Da natürlich ständig alles mögliche vorhergesagt wird, findet man im Rückblick auch fast immer jemanden, der mit seiner Vorhersage recht hatte - das halte ich aber doch eher für der statistischen Wahrscheinlichkeit geschuldet, dass von tausend Propheten wahrscheinlich einer zufällig ins Schwarze trifft.
"If the ideology you read is invisible to you, it usually means that it’s your ideology, by and large."

R. Scott Bakker

"We have failed to uphold Brannigan's Law. However I did make it with a hot alien babe. And in the end, is that not what man has dreamt of since first he looked up at the stars?" - Zapp Brannigan in Futurama

Verlag das Beben
Otherland-Buchhandlung
Schlotzen & Kloben
Blog
  • (Buch) gerade am lesen:Zachary Jernigan, No Return/James Tiptree Jr., Zu einem Preis
  • (Buch) als nächstes geplant:Samuel R. Delany, Dunkle Reflexionen/Thomas Ziegler, Sardor - Der Flieger des Kaisers
  • • (Buch) Neuerwerbung: Julie Phillips, James Tiptree Jr. (Biographie)
  • • (Film) gerade gesehen: Oblivion
  • • (Film) als nächstes geplant: Star Trek Into Darkness
  • • (Film) Neuerwerbung: American Horror Story (Serie)

#3 methom

methom

    Teetrinkonaut

  • Mitglieder
  • PIPPIPPIPPIPPIP
  • 4.615 Beiträge
  • Geschlecht:männlich

Geschrieben 09 Februar 2012 - 22:14

Google versucht zum Beispiel, aus den Eingaben in seiner Suche, Grippeepedemien hervorzusagen: http://www.google.org/flutrends/
Es scheinen also auch andere in die Richtung zu denken.

Biom Alpha ist im Sonnensystem angekommen. Jetzt auf eigener Seite und auf Twitter @BiomAlpha


#4 Trace

Trace

    Cyberpunk-o-Naut

  • Globalmoderator++
  • PIPPIPPIPPIPPIP
  • 2.316 Beiträge
  • Geschlecht:männlich
  • Wohnort:Sachsen

Geschrieben 09 Februar 2012 - 22:17

Das Problem würde dabei die Suche nach den richtigen Wörtern sein. Ich denke nicht, dass man hin geht und sagt:"He heute fordern wir mal Freiheit und Demokratie.". Menschen in einer Revolutionen wissen oft nicht das sie Teil der Revolution sind. Wenn ich an die Aufnahmen der DDR-Bürger von der Bornholmer Straße am 09. November denke, die ausgesagt haben, sie wollen sich nur mal den Westen anschauen und dann wieder zurück gehen. Sie müssen doch am nächsten Morgen wieder auf Arbeit sein. Ich denke nicht, dass der Großteil der Anwesenden dort die DDR stürzen wollten. Damit will ich sagen, dass sie dort sicherlich nicht hingegangen um die Demokratie zu fordern sondern nur weil es halt mal möglich den Westen zu sehen. Daher denke ich auch, dass man vorher eher über empfundene Ungerechtigkeiten, Willkür oder Unzufriedenheiten schreibt. Da wird es dann schon schwer treffende oder alle Suchbegriffe zu benennen. Meist demonstriert man ja gegen etwas als für etwas. Erst wenn man schon ein paar "gemeinsame" Erfahrungen auf der Straße gesammelt hat, kann man auch gegen ein gemeinsames Ziel demonstrieren, zum Beispiel gegen Polizeigewalt bei öffentlichen Veranstaltungen und öffentlich Diskussionen oder andere Repressalien. Vielleicht braucht man ein Maß für die Unzufriedenheit und wie man dies anhand der Nachrichten ermitteln kann. Aber das ist dann wohl keine quantitative Analyse mehr.

#5 Seti

Seti

    Zeitreisebegleiter durch die Windener Höhlen

  • Mitglieder
  • PIPPIPPIPPIPPIP
  • 1.957 Beiträge
  • Geschlecht:männlich

Geschrieben 09 Februar 2012 - 23:05

Ich meine, da steckt ein Denkfehler drin: Wenn du meinst, dass die Botschaften nicht Auslöser waren ihr Anstieg aber den Protesten vorausging, hast du erst mal nur eine Korrelation, bei der es dann ohne Kenntnis der unterstellten gemeinsamen Ursache ziemlich schwierig wird, aus dem Anstieg eines Faktors auch den eines anderen abzuleiten. Und dabei weißt du dann noch nicht mal, ob es überhaupt eine gemeinsame Ursache gibt. Solange nicht klar ist, ob es eine direkte kausale Abhängigkeit gibt, sehe ich da nicht viel Vorhersagepotential ...

Du hast recht, den Satz habe ich nicht so gut formuliert. Ich meinte, dass es zuerst einen Auslöser gibt (im Beispiel von Tunesien war dies ja, soweit ich weiß, ein Händler, der sich selbst angezündet hat). Auf den Auslöser folgt dann ein Anstieg von Botschaften im Netz, erst regional am Ort des Geschehens, dann sehr schnell überregional (und davon unabhängig vielleicht regional beschränkte Proteste). Aber der Kernpunkt dabei ist, dass die überregionalen Protestbotschaften den überregionalen Protesten zeitlich voraus sind. Und in den Städten, in denen dann vermehrt der Unmut gepostet und/oder abgerufen wird, könnte das Potenzial für reale Demonstrationen höher sein.
(hoffentlich war das jetzt besser ausgedrückt Eingefügtes Bild )

Google versucht zum Beispiel, aus den Eingaben in seiner Suche, Grippeepedemien hervorzusagen: http://www.google.org/flutrends/
Es scheinen also auch andere in die Richtung zu denken.

Stimmt, davon habe ich auch schon mal gelesen. Das ist ein gutes Beispiel Eingefügtes Bild

Daher denke ich auch, dass man vorher eher über empfundene Ungerechtigkeiten, Willkür oder Unzufriedenheiten schreibt. Da wird es dann schon schwer treffende oder alle Suchbegriffe zu benennen. Meist demonstriert man ja gegen etwas als für etwas. Erst wenn man schon ein paar "gemeinsame" Erfahrungen auf der Straße gesammelt hat, kann man auch gegen ein gemeinsames Ziel demonstrieren, zum Beispiel gegen Polizeigewalt bei öffentlichen Veranstaltungen und öffentlich Diskussionen oder andere Repressalien.

Vielleicht braucht man ein Maß für die Unzufriedenheit und wie man dies anhand der Nachrichten ermitteln kann. Aber das ist dann wohl keine quantitative Analyse mehr.

Okay, das ist ein guter Punkt. Mit einer Schlagwortesuche dürften viele Unmutsbekundungen durchs Raster fallen. Ich denke aber dennoch, dass die Auswertung von tausenden oder zehntausenden Postings und Blogs auf den Grad der enthaltenen Unzufriedenheit als quantitative Analye gelten könnte. Man bräuchte dafür allerdings ein Messgrät. Womit wir im Bereich der Fiktion wären... Andererseits kann eine Protestnote bei Facebook, die von 1000 Menschen "geliked" wurde, Auskunft darüber geben, was jemandem missfällt und wo dieser jemand herkommt - und das ist keine Fiktion.

Ich sollte vielleicht auch dazu sagen, dass es mir nicht um hundertprozentig richtige Voraussagen geht - denn dass diese unmöglich sind, beweisen ja schon alleine die Wettervorhersagen. Aber zumindest das Eingrenzen von Trends und potenziellen Veränderungen dürfte (bei einer ausreichend großen Menge von Daten und geeigneten Mitteln, diese zu analysieren) doch möglich sein.

"What today's nationalists and neosegregationists fail to understand," Kwame said, "is that the basis of every human culture is, and always has been, synthesis. No civilization is authentic, monolithic, pure; the exact opposite is true. Look at your average Western nation: its numbers Arabic, its alphabet Latin, its religion Levantine, its philosophy Greek†¦ need I continue? And each of these examples can itself be broken down further: the Romans got their alphabet from the Greeks, who created theirs by stealing from the Phoenicians, and so on. Our myths and religions, too, are syncretic - sharing, repeating and adapting a large variety of elements to suit their needs. Even the language of our creation, the DNA itself, is impure, defined by a history of amalgamation: not only between nations, but even between different human species!"

- The Talos Principle


#6 Jaktusch † 

Jaktusch † 

    Andronaut

  • Webmaster
  • 3.437 Beiträge
  • Geschlecht:männlich
  • Wohnort:Norddeutschland, auf dem Lande

Geschrieben 10 Februar 2012 - 00:17

Ist das nicht einfach nur eine Binsenweisheit? Je mehr Daten du von was auch immer sammelst, desto treffsicherer deine Prognose für was auch immer... Jaktusch
Man erwirbt keine Freunde, man erkennt sie.

#7 fictionality

fictionality

    Illuminaut

  • Mitglieder
  • PIPPIPPIPPIP
  • 917 Beiträge
  • Geschlecht:männlich
  • Wohnort:Schwarzwald

Geschrieben 10 Februar 2012 - 00:19

Ist ein plausibler Ansatz, nur die Umsetzung ist, wie schon angeklungen ist, etwas komplizierter als man denkt. Wichtig wären zunächst einmal empirische Studien über den Zusammenhang von bestimmten Wörtern und (historischen) Ereignissen. Hierzu müsste nicht nur das aktuelle Internet durchforstet werden, sondern auch Zeitungsartikel, Sachbücher etc. bis hinein ins 19. Jahrhundert. Selbst dann ist noch nicht zu 100 % gewährleistet, dass diese Studien auch brauchbare Ergebnisse für die Zukunft liefern. Aber als Denkansatz finde ich das durchaus interessant. Ich habe mich damit auch schon beschäftigt, es dann aber aufgegeben, weil die Menge an Daten von einem allein kaum zu bewältigen sind. Wie nennt man das denn? Gibt's dafür schon einen Namen? "Wor(l)d Correlation Analysis" vielleicht?

#8 Naut

Naut

    Semantomorph

  • Mitglieder
  • PIPPIPPIPPIPPIP
  • 4.222 Beiträge
  • Geschlecht:unbekannt

Geschrieben 10 Februar 2012 - 07:26

Über welche Art von Ereignissen reden wir denn hier? Natürlich kann man gewisse Vorkommnisse "vorhersagen", nämlich alle, die die Gedankenwelt der Menschen betreffen: Indem ich analysiere, worüber im Netz gesprochen wird, kann ich feststellen, worüber im Netz gesprochen wird. Das ist eine Tautologie, jawohl. Ich stelle fest, dass sich viele Leute über Grippe informieren, also interessieren sich viele Leute für Grippe. Das heißt nicht, dass viele Leute Grippe haben, sondern, dass sie kürzlich bei RTL2 einen Bericht darüber gesehen haben und außerdem gerade Erkältungszeit ist. Wenn ich wissen will, ob eine Grippewelle anrollt, dann sehe ich mir die Fälle in den Notaufnahmen an. Das Sein bestimmt das Bewusstsein, aber das heißt ja nicht, dass Sein und Bewusstsein kongruent sind, und schon gar nicht, dass Bewusstsein und das Reden über Bewusstseinsinhalte identisch. Bloß weil Justin Bieber täglich eine Million Klicks auf Facebook hat, heißt das nicht, dass er morgen zum Präsidenten gewählt wird. Tausend Klicks für John Asht heißen nicht tausend verkaufte Bücher.
Liest gerade: Atwood - Die Zeuginnen

#9 Diboo

Diboo

    Kaisertentakel

  • Mitglieder
  • PIPPIPPIPPIPPIP
  • 6.090 Beiträge
  • Geschlecht:männlich
  • Wohnort:Saarbrücken

Geschrieben 10 Februar 2012 - 08:20

Die empirische Sozialwissenschaft ist recht gut darin, einen Ist-Zustand zu beschreiben. Mit gewisser Sicherheit kann sie dort Angaben zur Zukunft machen, wo die Variablen überschaubar ist, man auf lange Zeitreihen an Datenmaterial zurückgreifen kann umd die Reichweite der Vorhersage nicht allzu weit in die Zukunft reicht. Wahlprognosen sind ein ganz gutes Beispiel dafür. Sobald die Variablen aber sehr viele werden oder der Zeitrahmen weit in die Zukunft geht oder man nicht über ausreichend belastbare Vorerhebungen verfügt, wird die Genauigkeit schnell geringer und endet bestenfalls in einer informierten Spekulation.

"Alles, was es wert ist, getan zu werden, ist es auch wert, für Geld getan zu werden."
(13. Erwerbsregel)

"Anyone who doesn't fight for his own self-interest has volunteered to fight for someone else's."
(The Cynic's book of wisdom)

Mein Blog
 


#10 methom

methom

    Teetrinkonaut

  • Mitglieder
  • PIPPIPPIPPIPPIP
  • 4.615 Beiträge
  • Geschlecht:männlich

Geschrieben 10 Februar 2012 - 12:33

Wichtig wären zunächst einmal empirische Studien über den Zusammenhang von bestimmten Wörtern und (historischen) Ereignissen. Hierzu müsste nicht nur das aktuelle Internet durchforstet werden, sondern auch Zeitungsartikel, Sachbücher etc. bis hinein ins 19. Jahrhundert. Selbst dann ist noch nicht zu 100 % gewährleistet, dass diese Studien auch brauchbare Ergebnisse für die Zukunft liefern.

Da müsstest du dann aber auch den Sprachwandel berücksichtigen. Ich denke in einer Tageszeitung von 1850 wurde ganz anders über ein Ereignis berichtet als heutzutage auf Twitter.

Biom Alpha ist im Sonnensystem angekommen. Jetzt auf eigener Seite und auf Twitter @BiomAlpha


#11 Seti

Seti

    Zeitreisebegleiter durch die Windener Höhlen

  • Mitglieder
  • PIPPIPPIPPIPPIP
  • 1.957 Beiträge
  • Geschlecht:männlich

Geschrieben 10 Februar 2012 - 20:49

Ist das nicht einfach nur eine Binsenweisheit?
Je mehr Daten du von was auch immer sammelst, desto treffsicherer deine Prognose für was auch immer...

Jaktusch

Im Prinzip schon. Nur musste man früher öffentliche Umfragen starten oder die Stammtische in den Kneipen aufsuchen, um zu erfahren, wie die Menschen zu bestimmten Sachverhalten stehen. Heutzutage ließe sich die öffentliche Meinung an abertausenden "Orten" des Cyberspace ablesen - mit den richtigen Filterprogrammen findet man wahrscheinlich auch in einem Schnittblumen-Forum Informationen über die politischen Ansichten der F(l)oristen... Und um diesen Unterschied zu früher und die mögliche Nutzung der gewonnenen Informationen geht es mir dabei.

Ist ein plausibler Ansatz, nur die Umsetzung ist, wie schon angeklungen ist, etwas komplizierter als man denkt.

Wichtig wären zunächst einmal empirische Studien über den Zusammenhang von bestimmten Wörtern und (historischen) Ereignissen. Hierzu müsste nicht nur das aktuelle Internet durchforstet werden, sondern auch Zeitungsartikel, Sachbücher etc. bis hinein ins 19. Jahrhundert. Selbst dann ist noch nicht zu 100 % gewährleistet, dass diese Studien auch brauchbare Ergebnisse für die Zukunft liefern.

Aber als Denkansatz finde ich das durchaus interessant. Ich habe mich damit auch schon beschäftigt, es dann aber aufgegeben, weil die Menge an Daten von einem allein kaum zu bewältigen sind.

Wie nennt man das denn? Gibt's dafür schon einen Namen? "Wor(l)d Correlation Analysis" vielleicht?

Die empirische Sozialwissenschaft ist recht gut darin, einen Ist-Zustand zu beschreiben. Mit gewisser Sicherheit kann sie dort Angaben zur Zukunft machen, wo die Variablen überschaubar ist, man auf lange Zeitreihen an Datenmaterial zurückgreifen kann umd die Reichweite der Vorhersage nicht allzu weit in die Zukunft reicht. Wahlprognosen sind ein ganz gutes Beispiel dafür.
Sobald die Variablen aber sehr viele werden oder der Zeitrahmen weit in die Zukunft geht oder man nicht über ausreichend belastbare Vorerhebungen verfügt, wird die Genauigkeit schnell geringer und endet bestenfalls in einer informierten Spekulation.

Ich bin ja, wie gesagt, durch William Gibson daraufgekommen und dort verfügt der Charakter Colin Laney über eine nodale Wahrnehmung, die aus einem Medikamentenexperiment resultiert und ihn diese Knotenpunkte schon beim Aufsetzen eines Datenhelms erkennen lässt. Das ist natürlich unmöglich.

Man braucht zur Bewältigung der Datenmengen leistungsfähige Computer, aber hat dabei immer das Problem, dass (momentan) kein noch so gut programmierter Algorithmus vollständig das menschliche Denken nachvollziehen kann. Ein Mensch könnte bspw. bei einem Blog zwischen den Zeilen lesen und somit auch ohne ein bestimmtes Schlagwort allein an der Art der Formulierung etwas erkennen - eine Maschine hingegen kann das wohl noch nicht, nehme ich an. Die schiere Menge an potentiell verwertbaren Daten und mit diesen zusammenhängenden Variablen dürfte also wahrscheinlich der Vorhersagbarkeit im Wege stehen, wenn es um komplexere Sachverhalte geht, z.B. Faktoren, die zu einer Demonstration führen können. Doch zumindest (politische, soziale, wirtschaftliche etc.) Trends müssten auch heutzutage schon erkennbar sein, ohne dafür Bürger zu befragen.

Programme zur Analyse gibt es ja schon (siehe Data-Mining und Web-Mining bei Wikipedia).

Über welche Art von Ereignissen reden wir denn hier?
Natürlich kann man gewisse Vorkommnisse "vorhersagen", nämlich alle, die die Gedankenwelt der Menschen betreffen: Indem ich analysiere, worüber im Netz gesprochen wird, kann ich feststellen, worüber im Netz gesprochen wird. Das ist eine Tautologie, jawohl. Ich stelle fest, dass sich viele Leute über Grippe informieren, also interessieren sich viele Leute für Grippe. Das heißt nicht, dass viele Leute Grippe haben, sondern, dass sie kürzlich bei RTL2 einen Bericht darüber gesehen haben und außerdem gerade Erkältungszeit ist.

Wenn ich wissen will, ob eine Grippewelle anrollt, dann sehe ich mir die Fälle in den Notaufnahmen an.

Das Sein bestimmt das Bewusstsein, aber das heißt ja nicht, dass Sein und Bewusstsein kongruent sind, und schon gar nicht, dass Bewusstsein und das Reden über Bewusstseinsinhalte identisch.
Bloß weil Justin Bieber täglich eine Million Klicks auf Facebook hat, heißt das nicht, dass er morgen zum Präsidenten gewählt wird. Tausend Klicks für John Asht heißen nicht tausend verkaufte Bücher.

Ich denke, dass Dinge, über die im Netz gesprochen wird, durchaus auch eine Auswirkung auf die reale Welt haben können. Der Cyberspace ist zwar kein Spiegelbild der wirklichen Welt, doch hat mit dieser mMn in der Vorhersagbarkeit immerhin eine Teilmenge gemeinsam - wenn man die richtigen Zusammenhänge herstellt. Beispielsweise können Internetstars, deren hochgeladene Songs milionenmal angeklickt wurden, zu wirklichen Stars werden, die dann Gold- und Platinplatten einheimsen. Und dieses Potenzial zur Berühmtheit lässt sich ablesen, bevor sie auch nur eine einzige Platte verkauft haben. Das Suchen nach diesen Internetphänomenen geschieht ja schon heutzutage.

Beim Beispiel der Grippeaufrufe dürfte es auch eine Teilmenge geben, die wirklich Grippesymptome zeigt. Du hast in dem Fall allerdings recht damit, dass Berichte aus den Krankenhäusern da heutzutage noch deutlich zuverlässiger sind. Doch eine Auflistung der Menschen, die bei Facebook, Twitter etc. sagen, dass sie momentan Husten und Schnupfen haben (und die gibt es bestimmt zur Genüge) kann auch Auskunft darüber geben, wenngleich keine so fundierte.

"What today's nationalists and neosegregationists fail to understand," Kwame said, "is that the basis of every human culture is, and always has been, synthesis. No civilization is authentic, monolithic, pure; the exact opposite is true. Look at your average Western nation: its numbers Arabic, its alphabet Latin, its religion Levantine, its philosophy Greek†¦ need I continue? And each of these examples can itself be broken down further: the Romans got their alphabet from the Greeks, who created theirs by stealing from the Phoenicians, and so on. Our myths and religions, too, are syncretic - sharing, repeating and adapting a large variety of elements to suit their needs. Even the language of our creation, the DNA itself, is impure, defined by a history of amalgamation: not only between nations, but even between different human species!"

- The Talos Principle


#12 Trace

Trace

    Cyberpunk-o-Naut

  • Globalmoderator++
  • PIPPIPPIPPIPPIP
  • 2.316 Beiträge
  • Geschlecht:männlich
  • Wohnort:Sachsen

Geschrieben 11 Februar 2012 - 09:02

Irgendwie kam mir das Thema doch bekannt vor und zwar aus Isaac Asimov - Foundations Trilogie. Dort führt er die Idee der Psychochistorik ein. Insbesondere in der Heyne Ausgabe die ich gelesen habe, gab es einen Anhang, in dem von einem Herrn Flynn einzelne Konzepte gesammelt wurden, wie denn die Psychochistorik aussehen könnte. Nur bräuchten diese Konzepte eine breitere Datenbasis als soziale Netze.

#13 jeamy

jeamy

    Infonaut

  • Mitglieder
  • PIPPIP
  • 295 Beiträge
  • Geschlecht:männlich

Geschrieben 11 Februar 2012 - 10:58

Start-up sucht spielerisch nach neuen Algorithmen

Das US-Start-up Kaggle organisiert erfolgreich Wettbewerbe, in denen die Teilnehmer aus Bergen von Daten scheinbar unmögliche Prognosen herausdestillieren sollen, berichtet Technology Review in seiner Online-Ausgabe. Kaggle setzt hierfür Informatiker an Universitäten und Experten in Unternehmen wie Google oder IBM aufeinander an. Demjenigen, der mit seinem Algorithmus die beste Prognose errechnet, winkt ein Geldpreis.
http://www.heise.de/...en-1430132.html

wer das nächste facebook sein möchte, sollte sich damit beschäftigen.

mostly harmless
jeamy

cropped-ws13-e1318926262753.jpg
»Das Leben ist das Resultat einer unvollkommenen Natur.«

Die Traumvektor Tetralogie ist kein Science-Fiction-Roman
»Morgen seid ihr alle tot. Denn sie kommen!«
Monsterseelen


#14 eRDe7

eRDe7

    Temponaut

  • Mitglieder
  • PIPPIPPIPPIPPIP
  • 1.116 Beiträge

Geschrieben 11 Februar 2012 - 11:09

Wenn ich mich richtig erinnere gab es im SPIEGEL letztes Jahr ein Bericht über so eine Unternehmung (von einem Schweizer oder so?); zudem gibt es seit den 90ern eine leicht esoterisch angehauchte Sache, die anhand von "Linguistik" im Netz versucht, Ereignisse vorher zu sagen (und angeblich häufig erfolgreich war): Clif Highs Web bot. (Clif High ist ein sehr interessanter Typ, der allerdings teils ziemlich abgefahrene Ansichten hat ...)

R. C. Doege: Ende der Nacht. Erzählungen (2010)

R. C. Doege: YUME. Träumen in Tokio (2020)

 


#15 Morn

Morn

    Temponaut

  • Mitglieder
  • PIPPIPPIPPIPPIP
  • 1.941 Beiträge
  • Geschlecht:männlich

Geschrieben 13 Februar 2012 - 17:27

Wie nennt man das denn? Gibt's dafür schon einen Namen? "Wor(l)d Correlation Analysis" vielleicht?


Solche Daten werden als unstrukturierte Daten bezeichnet, Die Analyse solcher Daten - sowie allgemein grosser Datenmengen - und das Erstellen von Prognosen aufgrund dieser Analysen scheint zur Zeit ein grosses Thema zu sein. Weitere Schlagwoerter sind hierbei Big Data und Predictive Analytics. Aehnliches, was Seti in seinem Eroeffnungsbeitrag anspricht, wird wohl schon praktiziert und laeuft unter Social Media Monitoring.

Eine Sendung beim Schweizer Radio zu dem Thema.

Ein Bericht vom World Economic Forum zu Big Data (pdf)

#16 Naut

Naut

    Semantomorph

  • Mitglieder
  • PIPPIPPIPPIPPIP
  • 4.222 Beiträge
  • Geschlecht:unbekannt

Geschrieben 14 Februar 2012 - 07:33


Solche Daten werden als unstrukturierte Daten bezeichnet,

Meinem Verständnis nach nicht. Was Sven meinte, war eher die Analyse wirklich großer Datensätze - wie z.B. das Auftreten bestimmter Schlagworte in Blogposts - deren Struktur aber bekannt ist, in dem Sinne, dass man einfach nach bestimmten Worten scannt.
Unstructured data bezeichnet aber Daten mit unbestimmter Struktur, in dem Sinne, dass die Art der Verwertung dieser Daten nicht a priori feststeht. In diesem Beispiel wäre das die Analyse von Blogposts, ohne dass ich vorher weiß, ob ich nach Buzzwords, Wortgruppen, dem auftreten bestimmter Sprachen, der Häufigkeit von Buchstaben, Bibelzitaten, Nicht-ASCII-Zeichen, usw. suche. Strategien, um mit solchen Daten klarzukommen, sind wesentlich komplexer als einfache Wortsuchen (die schon schlimm genug sein können).

Zugegeben, die Übergänge sind fließend.

Die Analyse solcher Daten - sowie allgemein grosser Datenmengen - und das Erstellen von Prognosen aufgrund dieser Analysen scheint zur Zeit ein grosses Thema zu sein. Weitere Schlagwoerter sind hierbei Big Data und Predictive Analytics. Aehnliches, was Seti in seinem Eroeffnungsbeitrag anspricht, wird wohl schon praktiziert und laeuft unter Social Media Monitoring.

Na klar! Der Wunsch nach Ordnung und Kontrolle war - besonders in der Wirtschaft - schon immer groß. Andererseits haben sich die "Lösungsansätze" auch seit den 1960ern kaum verändert: Neuronale Netze, Simulated Annealing, genetische Algorithmen. Oder anders formuliert: "Wir haben keine Ahnung, wie wir damit klarkommen sollen, deshalb packen wir erstmal unsere alten Im-Dunkeln-Herumtast-Algos aus."
Liest gerade: Atwood - Die Zeuginnen

#17 jeamy

jeamy

    Infonaut

  • Mitglieder
  • PIPPIP
  • 295 Beiträge
  • Geschlecht:männlich

Geschrieben 14 Februar 2012 - 08:04

am besten mal bei den geheimdiensten dieser welt nachfragen. die können vielleicht weiterhelfen.
http://de.wikipedia.org/wiki/Echelon
http://de.wikipedia.org/wiki/Enfopol

The Semantic Forest
http://www.schneier....ram-9912.html#3

http://www.google.de/patents/US5418951
http://www.google.co...epage&q&f=false
http://www.patentsto...ts/5937422.html
http://www.google.co...tents/US6973429
und tausende andere patente dieser art.
noch ein paar jahre warten und dann kann das jedes android oder iphone

Bearbeitet von jeamy, 14 Februar 2012 - 08:52.

mostly harmless
jeamy

cropped-ws13-e1318926262753.jpg
»Das Leben ist das Resultat einer unvollkommenen Natur.«

Die Traumvektor Tetralogie ist kein Science-Fiction-Roman
»Morgen seid ihr alle tot. Denn sie kommen!«
Monsterseelen


#18 simifilm

simifilm

    Cinematonaut

  • Mitglieder
  • PIPPIPPIPPIPPIP
  • 8.931 Beiträge
  • Geschlecht:männlich
  • Wohnort:Zürich

Geschrieben 14 Februar 2012 - 09:54

Korpuslinguistik, also die statistische Analyse grosser Textmengen, ist ja nichts grundsätzlich neues; mit dem Fortschreiten der Digitalisierung und dem Steigen der Rechenleistung können aber immer grössere Datensätze bearbeitet werden. Google zum Beispiel hat den Bestand von Google Books für statistische Analysen zugänglich gemacht. Vor knapp über einem Jahr wurden da unter relativ grossem Tamtam die Ergebnisse eines Teams von Harvard-Forschern veröffentlicht, das dieses Korpus ausgewertet haben (siehe den Artikel im Science). Und zumindest das, was ich damals darüber gelesen habe, hat mich nicht sonderlich beeindruckt. Die Erkenntnis, das der Name "Marc Chagall" in deutschen Publikationen zwischen 1933 und 1945 nur einmal auftaucht, finde ich nun nicht sonderlich überraschend. Wohlverstanden: Hier geht's nur um eine Analyse dessen, was war. Und bereits hier hängt der Wert der Analyse primär von der Fragestellung ab. Das ist keine sonderlich originelle Erkenntnis, aber auf die Idee, nach Chagall zu suchen, kann ich nur kommen, wenn ich schon eine ziemlich konkrete Hypothese habe (welche ganz banalen Probleme in diesem Feld lauern, zeigt auch dieser Thread, in dem es um die Häufigkeit der Begriffe "Science Fiction" und "Phantastik" geht). Die Probleme multiplizieren sich, wenn man von der Vergangenheit in die Zukunft wechselt.

Bearbeitet von simifilm, 14 Februar 2012 - 09:57.

Signatures sagen nie die Wahrheit.

Filmkritiken und anderes gibt es auf simifilm.ch.

Gedanken rund um Utopie und Film gibt's auf utopia2016.ch.

Alles Wissenswerte zur Utopie im nichtfiktionalen Film gibt es in diesem Buch, alles zum SF-Film in diesem Buch und alles zur literarischen Phantastik in diesem.
 

zfs40cover_klein.jpg ZFS16_Coverkleiner.jpg

  • (Buch) gerade am lesen:Samuel Butler: «Erewhon»
  • (Buch) als nächstes geplant:Samuel Butler: «Erewhon Revisited»
  • • (Film) gerade gesehen: «Suicide Squad»
  • • (Film) Neuerwerbung: Filme schaut man im Kino!

#19 Heidrun

Heidrun

    Giganaut

  • Mitglieder
  • PIPPIPPIPPIP
  • 601 Beiträge
  • Geschlecht:unbekannt
  • Wohnort:Jena

Geschrieben 14 Februar 2012 - 13:38

Es gäbe noch einen anderen Ansatzpunkt. Soziologen untersuchen regelmäßig Presse und sonstige Medien (eher nicht das Web), um die Wandlung von Wertungen nachzuvollziehen. Das scheint in gewisser Weise zu funktionieren. Wenn "Asyl" vorrangig zusammen mit Worten wie "Hilfe" oder "Kriegsopfer" vorkommt, spricht das für ein anderes gesellschaftliches Klima als bei "Missbrauch". Oder - mein Lieblingsthema - wird "Leiharbeit" eher mit "Einstiegschance" oder mit "Dumpinglohn" verknüpft? Wann wurde "Islam" plötzlich von einer Religion zu einer Spielart des Terrorismus? Politische Veränderungen (Verschärfung des Asylrechts, Deregulierung der Leiharbeit) werden von der jeweiligen Lobby entsprechend vorbereitet. Marketing ist alles, was man daran sieht, dass die Leute immer wieder Konzepten zustimmen, die ihren Interessen völlig zuwiderlaufen. Jeder Krieg wird mit einer Menge Rhetorik vorbereitet. Trends werden gemacht, die entstehen in den seltensten Fällen aus sich selbst, sogar wenn es sich um Revolten handelt. Dieses Social Engineering muss man finden, und das ist wahrscheinlich viel einfacher, als Millionen Foren und Blogs zu überwachen. Für viele Dinge reicht die BILD-Zeitung. Man kann vermutlich nicht vorhersagen, dass am 29.02.2012 in Athen eine Bombe hochgehen wird, aber man kann durchaus die Akzeptanz der Öffentlichkeit für Bomben auf Athen abschätzen. Und wenn mir einer so viel Geld böte, dass ich damit meinem Gewissen das Maul stopfen könnte, dann wüsste ich, wie man eine entsprechende Kampagne anfängt. Blöderweise hat mein Gewissen ein verdammt großes Maul.
  • (Buch) gerade am lesen:Gene Wolfe "Sword and Citadel"

#20 simifilm

simifilm

    Cinematonaut

  • Mitglieder
  • PIPPIPPIPPIPPIP
  • 8.931 Beiträge
  • Geschlecht:männlich
  • Wohnort:Zürich

Geschrieben 14 Februar 2012 - 13:51

Es gäbe noch einen anderen Ansatzpunkt. Soziologen untersuchen regelmäßig Presse und sonstige Medien (eher nicht das Web), um die Wandlung von Wertungen nachzuvollziehen. Das scheint in gewisser Weise zu funktionieren.


Wie schon angesprochen wurde, geschieht diese Analyse aber in aller Regel hinterher (und ist selbst da selten unumstritten).

Politische Veränderungen (Verschärfung des Asylrechts, Deregulierung der Leiharbeit) werden von der jeweiligen Lobby entsprechend vorbereitet. Marketing ist alles, was man daran sieht, dass die Leute immer wieder Konzepten zustimmen, die ihren Interessen völlig zuwiderlaufen. Jeder Krieg wird mit einer Menge Rhetorik vorbereitet. Trends werden gemacht, die entstehen in den seltensten Fällen aus sich selbst, sogar wenn es sich um Revolten handelt. Dieses Social Engineering muss man finden, und das ist wahrscheinlich viel einfacher, als Millionen Foren und Blogs zu überwachen. Für viele Dinge reicht die BILD-Zeitung.
Man kann vermutlich nicht vorhersagen, dass am 29.02.2012 in Athen eine Bombe hochgehen wird, aber man kann durchaus die Akzeptanz der Öffentlichkeit für Bomben auf Athen abschätzen. Und wenn mir einer so viel Geld böte, dass ich damit meinem Gewissen das Maul stopfen könnte, dann wüsste ich, wie man eine entsprechende Kampagne anfängt. Blöderweise hat mein Gewissen ein verdammt großes Maul.


Bis zu einem gewissen Grad haben wir es hier mit einer typischen Huhn-Ei-Problematik zu tun. Entstehen Trends, weil sie gemacht werden, wird also die Öffentlichkeit bearbeitet, damit sie einen Trend schluckt, oder muss schon eine generelle Bereitschaft da sein, damit ein Trend verfängt. Marketing kann vieles ausrichten, aber wie Dir jeder Werber bestätigen wird, gibt es trotz allem nie eine Garantie, dass eine Kampagne tatsächlich zünden wird, weil die Menschen allen Manipulationsmechanismen zum Trotz höchst eigenwillig reagieren können.

Signatures sagen nie die Wahrheit.

Filmkritiken und anderes gibt es auf simifilm.ch.

Gedanken rund um Utopie und Film gibt's auf utopia2016.ch.

Alles Wissenswerte zur Utopie im nichtfiktionalen Film gibt es in diesem Buch, alles zum SF-Film in diesem Buch und alles zur literarischen Phantastik in diesem.
 

zfs40cover_klein.jpg ZFS16_Coverkleiner.jpg

  • (Buch) gerade am lesen:Samuel Butler: «Erewhon»
  • (Buch) als nächstes geplant:Samuel Butler: «Erewhon Revisited»
  • • (Film) gerade gesehen: «Suicide Squad»
  • • (Film) Neuerwerbung: Filme schaut man im Kino!

#21 Metabaron

Metabaron

    Nochkeinnaut

  • Mitglieder
  • 3 Beiträge
  • Geschlecht:männlich

Geschrieben 14 Juni 2012 - 23:08

Auch mich erinnert das ein wenig an Asimovs "Futurologie" der Foundation-Trilogie, und da kann ich mich nur ans Soziologie-Studium erinnern, wo genau dieses Thema kurz angesprochen wurde und der Fehler bei diesem Konzept hervorgehoben wurde: externe Ereignisse. Wenn man sagt, dass man beispielsweise ein zukünftiges kollektives Phänomen vorhersagen möchte, dann macht man Aussagen über ein soziales System zu einem bestimmten Zeitpunkt, der noch nicht geschehen ist. Ein existierendes kollektives Phänomen lässt sich erklären, indem man den Übergang von "sozialem System 1" zu "sozialem System 2" untersucht und dabei gewisse Regeln einhält (z. B. Erklärung des Phänomens "Urbanisierung"). Ohne jetzt zu weit ins Detail gehen zu wollen, besteht hier die Möglichkeit, den Einfluss von externen Ereignissen auf das System 1 zu berücksichtigen und in die Erklärung einzubauen. Da man aber bei zukünftigen Systemen keine Informationen über (system-)externe Ereignisse hat, reichen die Daten prinzipiell nie aus. Man kann zwar eine Art Systemevolution vorrechnen (System 1 -> System 2 -> System 3,... etc.), aber da man einfach keine Daten über zukünftige externe Ereignisse auf das System hat, ist jede Voraussage reine Spekulation und hat keine wirkliche Aussagekraft, selbst wenn sie zufällig zutreffen sollte. Ich glaube ein Beispiel ist die Vorhersage des Zusammenbruchs der ehemaligen Sowjetunion. Zum damaligen Zeitpunkt konnte man nicht gerade von ferner Zukunft sprechen, aber so gut wie kein Soziologe hat den Zusammenbruch vorhersehen/-rechnen können, stattdessen wurde eher in der Presse darüber geschrieben. Aber die erhöhte Trefferquote in der Presse wiederum ist natürlich als Erklärung und Prognose wissenschaftlich unbrauchbar. Das ist der Hauptgrund, warum für mich die Vorhersage von Ereignissen (zumindest soziologischer Natur) trotz großem Datensatz nicht möglich ist.

Bearbeitet von Metabaron, 14 Juni 2012 - 23:09.


#22 Torwan

Torwan

    Cybernaut

  • Mitglieder
  • PIPPIPPIP
  • 394 Beiträge
  • Geschlecht:männlich

Geschrieben 15 Juni 2012 - 08:10

Mir ist beim Lesen des Eingangsposts eine andere Parallele eingefallen. In heißen und kalten Kriegen wird der Funkverkehr des Feindes beobachtet und auch auf solche "Muster" untersucht. Selbst wenn die Kommunikation verschlüsselt ist und man nichts versteht, kann man aus einem ungewöhnlichen Anstieg der Kommunikation Schlüsse ziehen: - Etwas passiert demnächst - Täuschungsmanöver Wenn man dann sogar Teile des Funkverkehrs versteht, kann man umso mehr in die Materie eintauchen. Ich vermute mal, dass es beim Internet ähnliche Möglichkeiten gibt, allerdings hängt da die Qualität der Aussage von der Qualität der Analyse-Software und der Analysten ab. Ansonsten vermutet man eine Revolution, obwohl tatsächlich nur ein Film mit dem Wort "Freiheit" im Titel rausgekommen ist und runtergeladen wird.


Besucher die dieses Thema lesen: 1

Mitglieder: 0, Gäste: 1, unsichtbare Mitglieder: 0