Computergestützte Analyse Sozialwissenschaftlicher Texte mit Hilfe maschineller Lernverfahren – eine Analysemethode entwickelt im Kooperation des Instituts für E-Beratung, Fakultät Sozialwissenschaften, Prof. Robert Lehmann und der Fakultät für Informatik, Prof. Jens Albrecht.
CASoTex kann mit Einsatz computerlinguistischer Methoden und maschineller Lernverfahren zur automatisierten Analyse, sozialwissenschaftliche Texte unter verschiedenen Aspekten analysieren. Die Datengrundlage bilden digital vorliegende Texte aus Mail-, Chat- oder Forenberatung.
Im Vorlaufforchungs-Projekt CASoTex wurden erste konkrete Erkenntnisse generiert. Der Forschungsstand vergrößert sich mit der Praxis in weiteren Forschungsprojekten.
Onlineberatung wird computervermittelt durchgeführt, somit sind alle Elemente des Beratungsprozesses digital vorhanden. Da Onlineberatung in den letzten Jahren bereits in vielen Kontexten eingesetzt wurde, liegen an verschiedenen Stellen große Mengen dieser Daten vor.
Damit entsteht die für Soziale Arbeit relativ einmalige Situation, dass das fachliche Handeln der BeraterInnen nahezu vollständig dokumentiert ist. Weiterhin bietet diese Tatsache die Chance, durch geeignete Datenanalyseverfahren ein tieferes Verständnis des Beratungsprozesses und der Wirkungszusammenhänge der beraterischen Interventionen zu erlangen. Bisher konnten diese Daten mit den klassischen Methoden der sozialwissenschaftlichen Text- und Inhaltsanalyse untersucht werden. Da diese Verfahren alle sehr aufwändig sind, konnten damit nie größere Datenbestände vollständig untersucht werden, sondern es mussten relativ kleine Stichproben gebildet werden. Mit Hilfe maschineller Lernverfahren aus den Bereichen Big Data, Text Mining und Natural Language Processing besteht nun die Möglichkeit, auch sehr großen Datenmengen wissenschaftlich zu analysieren.
Projekte
Veröffentlichungen
Robert Lehmann & Mara Stieler (2022). Chancen und Risiken KI gestützter Evaluationsmethoden textbasierter Kommunikation. Suchttherapie 2022; 23(01), S. 54. DOI: 10.1055/s-0042-1756095
Lehmann, Robert; Albrecht, Jens & Zauter, Sigrid (2021): Die Computerunterstützte Analyse Sozialwissenschaftlicher Texte – Ergebnisse des Forschungsprojekts „Casotex“ in der psychosozialen Onlineberatung. In: Carolin Freier; Joachim König; Arne Manzeschke & Barbara Städtler-Mach (Hrsg.): Gegenwart und Zukunft sozialer Dienstleistungen. Wiesbaden: Springer. ISBN 978-3-658-32556-5
Grandeit, Philipp; Haberkern, Carolyn; Lang, Maximiliane; Albrecht, Jens & Lehmann, Robert (2020): Using BERT for Qualitative Content Analysis in Psycho-Social Online Counseling. 4TH WORKSHOP ON NLP AND CSS at the EMNLP 2020 The 2020 Conference on Empirical Methods in Natural Language Processing. https://www.aclweb.org/anthology/2020.nlpcss-1.2/
Lehmann, Robert; Albrecht, Jens & Zauter, Sigrid (2020): CaSoTex, Computerunterstützte Analyse Sozialwissenschaftlicher Texte. E-Beratung, 2020 (1). doi: 10.34646/thn/ohmdok-619.
Studentische Arbeiten
Prof. Dr. Jens Albrecht an der Fakultät Informatik und Prof. Dr. Robert Lehmann an der Sozialwissenschaftlichen Fakultät bieten in Zusammenarbeit mit dem Institut für E-Beratung interessierten Bachelor- oder Masterstudierenden der TH Nürnberg Unterstützung bei studentischen Arbeiten an.
- Synthetische Datengenerierung mit Large Language Models im Kontext sozialer Online-Beratung, Stefan Arnold (BA 2023, Informatik: Prof. Jens Albrecht, Institut für E-Beratung: Eric Rudolph)
- Konzeption und Implementierung eines adaptiven und fehlertoleranten Web-Crawlers im CASOTEX-Projek, Jan Kuffner (BA 2023, Informatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
- Konzeption und Implementierung einer Web-Applikation für die interaktive Visualisierung, Modellierung und Filterung textueller Daten, Kaan Götürmen (BA 2021, Informatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
- Anwendung der Modelle für die Erkennung qualitativer Katogerien und Emotionen zur Erkennung von Mustern in Beratungskonversationen, Marco Reichart (BA 2021, Informatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
- Emotionsanalyse von automatisch übersetzten Texten mithilfe maschineller Lernverfahren, Amelie Schmidt (BA 2020, Informatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
- Implementierung einer erweiterbaren Webanwendung zur interaktiven Textvisualisierung, Philipp Jäger (BA 2020, Informatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
- Untersuchung aktueller maschineller Lernverfahren zur Erkennung von Emotionen in Beratungsverläufen, Adam Konieczny (BA 2019, Informatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
- Einsatz maschineller Lernverfahren zur automatischen Erkennung psycho-sozialer Kategorien in Forenbeiträgen, Anna Zvurska (BA 2019, Informatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
- Anonymisierung von natürlichsprachigen Texten, Armin Bredow (MA 2019, Informatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
- Erkennung forenübergreifender, psychosozialer Fragestellungen über computergestützte Textanalyse. Lena Kallenbach, Sandra Schumann, Saskia Spengler, Dominik Wagner, Valeria Wilhelm (IT-Projekt 2019, Informatik: Prof. Jens Albrecht, Institut für E-Beratung Prof. Robert Lehmann)
- Parametrisierte Visualisierungsinstrumente von Ergebnissen automatisierter Inhaltsanalyse, Simona Pankatova, (BA 2019, Wirtschaftsinformatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
- Qualitativen Inhaltsanalyse nach Mayring an Datensätzen zur psychosozialen Forenberatung: Erstellung eines prototypischen Kategoriensystems nach Mayring. Überprüfung des Kategoriensystems am Material. Übertragung des Kategoriensystems in die Casotex-Software. Kodieren möglichst großer Teile der Datenbasis. (Projektgruppe (WiSe 2018/19) aus dem Master Soziale Arbeit bei Prof. Lehmann)
- Inhaltsanalyse von sozialen Beratungsforen mit maschinellen Lernverfahren, Jean-Pierre Widerhold, (BA 2018/19, Wirtschaftsinformatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
- Analyse der bke Elternberatungsforums mit unüberwachten Lernverfahren. Viktor Schuller, Jean-Pierre Widerhold, Anna Zvurszka (Arbeitsgruppe (SoSe 2018) im Rahmen der Informatik Vorlesung “Text Analytics” von Prof. Jens Albrecht)