FAQ
Technologie & Unternehmen
Can you tell us in two sentences what you do and how it works?
Die KI EMOTION ANALYTICS hat mithilfe von Millionen Datensätzen und einem mehrstufigen Modellierungsprozess gelernt, psychologische Ergebnisse aus geschriebener und gesprochener Sprache zu extrahieren. Die Ergebnisse können überall dort nutzbringend angewendet werden, wo Kommunikation eine Rolle spielt.
Wie funktioniert EMOTION ANALYTICS?
EMOTION ANALYTICS ist eine künstlich intelligente Technologie, die aus gesprochener und geschriebener Sprache psychologische Ableitungen trifft. Die Technologie wurde dafür in groß angelegten Studien trainiert:
In einer ersten Studie wurde ein psychologisches Modell entwickelt, das Sprache möglichst ganzheitlich mit 29 aus der Literatur abgeleiteten und mathematisch geprüften Konstrukten abbildet. In einer zweiten (kontinuierlich weiterlaufenden) Studie wurde der Technologie beigebracht, diese Konstrukte in der Sprache möglichst situationsunabhängig zu erkennen. Dafür wurden Millionen Bewertungen zu Texten in verschiedenen Kontexten erhoben und die kleinteilige Analyse der Sprache weiter verfeinert, sodass das mathematische Abbild der Sprache durch die KI mit den Bewertungen zusammengebracht werden konnte. Ein mehrstufiger Modellierungsprozess stellt dabei die Qualität der Aussagen sicher.
Jetzt etwas genauer - Wie wertet EMOTION ANALYTICS Sprache/Texte aus? Nach welchen Kriterien sucht der Algorithmus?
Die Analyse findet immer auf Grundlage eines Textes statt. Gesprochene Sprache wird also vor der Analyse automatisch transkribiert. EMOTION ANALYTICS hat gelernt, Sprache zu „verstehen", indem die Technologie ein Modell mit mehr als 110 Millionen Parametern verwendet. Beispielhafte Parameter sind Worte, Wortkombinationen, Grammatik, die Position und Art (Adjektiv, Nomen) eines Wortes im Text und so weiter. EMOTION ANALYTICS sucht also nicht nach vorher von Menschen festgelegten Kriterien, sondern basiert auf einem mathematischen Modell von Sprache.
Durch dieses ganzheitliche mathematische Verständnis der Sprache kann maschinelles Lernen stattfinden. EMOTION ANALYTICS bekommt im Training beispielsweise Texte gezeigt, die einen hohen oder geringen Wert in einem der messbaren Ergebnisse haben sollten. Das können zum Beispiel wissenschaftliche Artikel für eine hoch „intellektuelle" Kommunikation - und Artikel aus Boulevardzeitungen für eine gering „intellektuelle" Kommunikation sein. Zusätzlich werden der Technologie Millionen bewertete Textpassagen gezeigt. Für diese Textpassagen haben mehrere Rater anhand von speziell entwickelten ltems eingeschätzt, ob sie „intellektuell" sind. Aus der Gesamtheit der Informationen baut die Technologie sich ein Modell für „intellektuell" und lernt zu erkennen, welche Aspekte der Sprache (aus dem Modell mit 110 Millionen Parametern) relevant für das Konstrukt sind.
Wenn ein Modell gebaut wurde, wird an einem Datensatz (DEV-Daten) geprüft, ob das Modell gut funktioniert. Der DEV-Datensatz besteht aus weiteren Ratings von Textpassagen durch mehrere Rater, die anhand der entwickelten ltems eingeschätzt wurden. Ist das Modell gut oder besser als das vorherige, kann der nächste Schritt kommen. Ist das Modell nicht besser als das vorherige, geht es wieder ins Training. Dann werden neue Trainingsmethoden oder andere Trainingsdaten verwendet. Zum Beispiel werden EMOTION ANALYTICS hochwertige Zeitungen statt wissenschaftlicher Artikel gezeigt, da es möglich wäre, dass die Technologie durch die wissenschaftlichen Artikel zu spezifische Aspekte der „intellektuellen" Kommunikation gelernt hat. Alternativ können auch mehr Ratings eingesammelt werden, etc.
Ist das Modell am DEV-Datensatz besser geworden, kommt der TEST-Datensatz zum Einsatz. Der TEST-Datensatz ist ähnlich aufgebaut wie der DEV-Datensatz und besteht auch aus Millionen Ratings zu Textstellen. Entscheidend ist, dass DEV- und TEST-Datensatz vollkommen getrennte Datensätze sind. Ist die Güte beim TEST-Datensatz ähnlich gut wie beim DEV Datensatz, kann davon ausgegangen werden, dass EMOTION ANALYTICS ein stabiles und gutes Modell gelernt hat. Das Modell kann released werden. Ist die Güte besser oder schlechter als beim DEV-Datensatz, beginnt die Fehlersuche. Eine deutlich unterschiedliche Güte zum DEV Datensatz kann verschiedene Gründe haben. Je nach Ursache werden weitere Schritte angestoßen.
Kommt ein neuer Text in das releaste Modell, wendet die Technologie die aus dem beschriebenen Modellierungsprozess gelernten und geprüften Informationen an und sucht nach den Aspekten aus den 110 Millionen Parametern, die sich als wertvoll für die Aussage über das Ergebnis herausgestellt haben. Was relevant für ein Ergebnis ist, hat EMOTION ANALYTICS also anhand eines aufwändigen Modellierungsprozesses gelernt, ohne das von außen vorgegeben wurde, welche Parameter für ein Ergebnis relevant sind.