Maschinelles Lesen: Unterschied zwischen den Versionen
Aus exmediawiki
C.heck (Diskussion | Beiträge) |
C.heck (Diskussion | Beiträge) |
||
Zeile 79: | Zeile 79: | ||
=How to get the trainigdata?= | =How to get the trainigdata?= | ||
<small><code>exMedia_Machines/Seminar_Einführung-in-die-Programmierung-KI/04_07-11_maschinelles-lesen/loesungen/'''load_scrape-data.ipynb'''</code></small> | <small><code>exMedia_Machines/Seminar_Einführung-in-die-Programmierung-KI/04_07-11_maschinelles-lesen/loesungen/'''load_scrape-data.ipynb'''</code></small> | ||
+ | |||
+ | see more...: https://www.nltk.org/book/ch03.html | ||
+ | |||
==File aus eigener Datenbank einlesen== | ==File aus eigener Datenbank einlesen== | ||
filename = 'Dateipfad' | filename = 'Dateipfad' | ||
Zeile 91: | Zeile 94: | ||
Tweets gefiltert nach Hashtag scrapen: https://medium.com/@limavallantin/mining-twitter-for-sentiment-analysis-using-python-a74679b85546 | Tweets gefiltert nach Hashtag scrapen: https://medium.com/@limavallantin/mining-twitter-for-sentiment-analysis-using-python-a74679b85546 | ||
− | + | ==Webseiten downloaden== | |
+ | im Html-Format: | ||
+ | url = "https://theorieblog.attac.de/quo-vadis-homo-spiens/" | ||
+ | html = request.urlopen(url).read().decode('utf8') | ||
+ | print(html[:60]) | ||
− | + | schon im Textformat (z.B. von Gutenberg): | |
− | + | from urllib import request | |
+ | url = "http://www.gutenberg.org/files/2554/2554-0.txt" | ||
+ | response = request.urlopen(url) | ||
+ | raw = response.read().decode('utf8') | ||
+ | print(raw[1000:1275]) | ||
=Text-Preprocessing= | =Text-Preprocessing= | ||
=Rechnen mit Wörtern...= | =Rechnen mit Wörtern...= |
Version vom 6. November 2019, 12:06 Uhr
07.11.2019
alle Notebook findet ihr unter /exMedia_Machines/:
exMedia_Machines/Seminar_Einführung-in-die-Programmierung-KI/04_07-11_maschinelles-lesen/loesungen/01_sentiment-analyses_german-txt.ipynb
exMedia_Machines/Seminar_Einführung-in-die-Programmierung-KI/04_07-11_maschinelles-lesen/loesungen/load_scrape-data.ipynb
exMedia_Machines/Seminar_Einführung-in-die-Programmierung-KI/04_07-11_maschinelles-lesen/loesungen/01_sentiment-analyses_german-txt.ipynb
exMedia_Machines/Seminar_Einführung-in-die-Programmierung-KI/04_07-11_maschinelles-lesen/loesungen/01_sentiment-analyses_german-txt.ipynb
das Natural Language Toolkit NLTK zu installieren
open conda and type:
conda install nltk
Inhaltsverzeichnis
Sentiment Analysis
in short:
Opinion Mining (manchmal als Stimmungsanalyse oder Emotion AI ) bezieht sich auf
- die Verwendung von natürlicher Sprachverarbeitung, Textanalyse , Computerlinguistik und Biometrie,
- systematisches Identifizieren, Extrahieren, Quantifizieren und studieren affektiver Zustände, sowie subjektiver Informationen.
Generell zielt Sentimentanalyse darauf ab, die Haltung eines Sprechers/Autors in Bezug auf einige Themen oder die kontextuelle Polarität / emotionale Reaktion auf ein Dokument, eine Interaktion, oder ein Ereignis zu bestimmen.
Wikipedia:
Sentiment Detection (auch Sentimentanalyse, englisch für „Stimmungserkennung“) ist ein Untergebiet des Text Mining und bezeichnet die automatische Auswertung von Texten mit dem Ziel, eine geäußerte Haltung als positiv oder negativ zu erkennen.
textblob
TextBlob ist ein Tool für natural language processing (NLP) mit Python.
Mit Textblob sind viele Ansätze wie etwa Erkennen von Wortarten, Extraktion von Substantiven, Stimmungsanalyse und auch Klassifizierungen möglich.
deutschsprachige Texte
exMedia_Machines/Seminar_Einführung-in-die-Programmierung-KI/04_07-11_maschinelles-lesen/loesungen/01_sentiment-analyses_german-txt.ipynb
textblob-de installieren
Die Installation von textblob-de erfolgt in zwei Schritten.
1.Terminal start & type:
pip install -U textblob-de
„-U“ sorgt dafür, dass alle notwendigen Abhängigkeiten auf die neueste Version gebracht werden.
2. Sprachmodelle und Sprachdaten aus dem Natural Language Toolkit (NLTK) hinzufügen:
python3 -m textblob.download_corpora
first steps...
type in your Notebook:
from textblob_de import TextBlobDE
textsnippet = TextBlobDE("Das ist alles wunderschön.")
print(textsnippet.sentiment)
englischsprachiger Texte
see notebook: ???
textblob installieren
type in terminal:
pip install -U textblob
first steps...
type in your Notebook:
from textblob import TextBlob
textsnippet = TextBlob('not a very great experiment')
print(textsnippet.sentiment)
How to get the trainigdata?
exMedia_Machines/Seminar_Einführung-in-die-Programmierung-KI/04_07-11_maschinelles-lesen/loesungen/load_scrape-data.ipynb
see more...: https://www.nltk.org/book/ch03.html
File aus eigener Datenbank einlesen
filename = 'Dateipfad' file = open(filename, 'rt') amw1 = file.read() file.close()
vorbearbeitete Trainingsdatenbanken
links hierein
Tweets scrapen
Tweets gefiltert nach Hashtag scrapen: https://medium.com/@limavallantin/mining-twitter-for-sentiment-analysis-using-python-a74679b85546
Webseiten downloaden
im Html-Format:
url = "https://theorieblog.attac.de/quo-vadis-homo-spiens/" html = request.urlopen(url).read().decode('utf8') print(html[:60])
schon im Textformat (z.B. von Gutenberg):
from urllib import request url = "http://www.gutenberg.org/files/2554/2554-0.txt" response = request.urlopen(url) raw = response.read().decode('utf8') print(raw[1000:1275])