← Zum vorherigen Versionsunterschied Zum nächsten Versionsunterschied →

Version vom 6. November 2019, 13:06 Uhr

07.11.2019

alle Notebook findet ihr unter /exMedia_Machines/:

exMedia_Machines/Seminar_Einführung-in-die-Programmierung-KI/04_07-11_maschinelles-lesen/loesungen/01_sentiment-analyses_german-txt.ipynb

exMedia_Machines/Seminar_Einführung-in-die-Programmierung-KI/04_07-11_maschinelles-lesen/loesungen/load_scrape-data.ipynb

exMedia_Machines/Seminar_Einführung-in-die-Programmierung-KI/04_07-11_maschinelles-lesen/loesungen/01_sentiment-analyses_german-txt.ipynb

das Natural Language Toolkit NLTK zu installieren

open conda and type:

conda install nltk

Sentiment Analysis

in short:

Opinion Mining (manchmal als Stimmungsanalyse oder Emotion AI ) bezieht sich auf

die Verwendung von natürlicher Sprachverarbeitung, Textanalyse , Computerlinguistik und Biometrie,
systematisches Identifizieren, Extrahieren, Quantifizieren und studieren affektiver Zustände, sowie subjektiver Informationen.

Generell zielt Sentimentanalyse darauf ab, die Haltung eines Sprechers/Autors in Bezug auf einige Themen oder die kontextuelle Polarität / emotionale Reaktion auf ein Dokument, eine Interaktion, oder ein Ereignis zu bestimmen.

Wikipedia:

Sentiment Detection (auch Sentimentanalyse, englisch für „Stimmungserkennung“) ist ein Untergebiet des Text Mining und bezeichnet die automatische Auswertung von Texten mit dem Ziel, eine geäußerte Haltung als positiv oder negativ zu erkennen.

see: https://de.wikipedia.org/wiki/Sentiment_Detection#Einf%C3%BChrung

textblob

TextBlob ist ein Tool für natural language processing (NLP) mit Python.

Mit Textblob sind viele Ansätze wie etwa Erkennen von Wortarten, Extraktion von Substantiven, Stimmungsanalyse und auch Klassifizierungen möglich.

deutschsprachige Texte

exMedia_Machines/Seminar_Einführung-in-die-Programmierung-KI/04_07-11_maschinelles-lesen/loesungen/01_sentiment-analyses_german-txt.ipynb

textblob-de installieren

Die Installation von textblob-de erfolgt in zwei Schritten.

1.Terminal start & type:

pip install -U textblob-de

„-U“ sorgt dafür, dass alle notwendigen Abhängigkeiten auf die neueste Version gebracht werden.

2. Sprachmodelle und Sprachdaten aus dem Natural Language Toolkit (NLTK) hinzufügen:

python3 -m textblob.download_corpora

first steps...

type in your Notebook:

from textblob_de import TextBlobDE

textsnippet = TextBlobDE("Das ist alles wunderschön.")

print(textsnippet.sentiment)

englischsprachiger Texte

see notebook: ???

textblob installieren

type in terminal:

pip install -U textblob

first steps...

type in your Notebook:

from textblob import TextBlob

textsnippet = TextBlob('not a very great experiment')

print(textsnippet.sentiment)

How to get the trainigdata?

exMedia_Machines/Seminar_Einführung-in-die-Programmierung-KI/04_07-11_maschinelles-lesen/loesungen/load_scrape-data.ipynb

see more...: https://www.nltk.org/book/ch03.html

File aus eigener Datenbank einlesen

filename = 'Dateipfad'
file = open(filename, 'rt')
amw1 = file.read()
file.close()

vorbearbeitete Trainingsdatenbanken

links hierein

Tweets scrapen

Tweets gefiltert nach Hashtag scrapen: https://medium.com/@limavallantin/mining-twitter-for-sentiment-analysis-using-python-a74679b85546

Webseiten downloaden

im Html-Format:

url = "https://theorieblog.attac.de/quo-vadis-homo-spiens/"
html = request.urlopen(url).read().decode('utf8')
print(html[:60])

schon im Textformat (z.B. von Gutenberg):

from urllib import request
url = "http://www.gutenberg.org/files/2554/2554-0.txt"
response = request.urlopen(url)
raw = response.read().decode('utf8')
print(raw[1000:1275])

Maschinelles Lesen: Unterschied zwischen den Versionen

Aus exmediawiki

Version vom 6. November 2019, 13:06 Uhr

Inhaltsverzeichnis

Sentiment Analysis

textblob

deutschsprachige Texte

textblob-de installieren

first steps...

englischsprachiger Texte

textblob installieren

first steps...

How to get the trainigdata?

File aus eigener Datenbank einlesen

vorbearbeitete Trainingsdatenbanken

Tweets scrapen

Webseiten downloaden

Text-Preprocessing

Rechnen mit Wörtern...

@@ Zeile 79: / Zeile 79: @@
 =How to get the trainigdata?=
 <small><code>exMedia_Machines/Seminar_Einführung-in-die-Programmierung-KI/04_07-11_maschinelles-lesen/loesungen/'''load_scrape-data.ipynb'''</code></small>
+see more...: https://www.nltk.org/book/ch03.html
 ==File aus eigener Datenbank einlesen==
   filename = 'Dateipfad'
@@ Zeile 91: / Zeile 94: @@
 Tweets gefiltert nach Hashtag scrapen: https://medium.com/@limavallantin/mining-twitter-for-sentiment-analysis-using-python-a74679b85546
-Pdf's/Webseiten downloaden==
+==Webseiten downloaden==
+im Html-Format:
+ url = "https://theorieblog.attac.de/quo-vadis-homo-spiens/"
+ html = request.urlopen(url).read().decode('utf8')
+ print(html[:60])
- (see more...: https://www.nltk.org/book/ch03.html)
+schon im Textformat (z.B. von Gutenberg):
-. noch mehr Handarbeit... << siehe Verena
+ from urllib import request
+ url = "http://www.gutenberg.org/files/2554/2554-0.txt"
+ response = request.urlopen(url)
+ raw = response.read().decode('utf8')
+ print(raw[1000:1275])
 =Text-Preprocessing=
 =Rechnen mit Wörtern...=