KHM-Wolke

was bietet euch diese Cloud?:

Filesharing zwischen eigenen und den Lab-Rechnern
Eigene Cloud
Eigener Kalender, Passwortcontainer, Mindmaps etc.
Frontend für euren E-Mail Account

Link zu unserem Seminars-Filesharing-Ordner: Seminars-Cloud oder neuer link???

Experimentelle Informatik - Kalender: https://wolke.khm.de/index.php/apps/calendar/p/n6a59z9AnKKnFgTz/exLabIII

...zum Download im *.ics Format: https://wolke.khm.de/remote.php/dav/public-calendars/n6a59z9AnKKnFgTz?export

Vorstellungsrunde

human@machine $ whoareyou

Frage1 an euch:

was richtete eure aufmerksamkeit in den letzten tagen/wochen/monaten besonders auf sich? d.h. welche debatten, news, diskussionen mit euren freunden/bekannten in diesem kontext?

human@machine $ whoami

Frage2 an mich: was passiert wenn wir mit hilfe von künstlicher intelligenz beginnen soziale klassen zu unterscheiden, bzw. sogar sie selbst klassifizieren zu lassen?

oktober 2019: https://www.theguardian.com/technology/2019/oct/16/automated-messages-welfare-australia-system

In Australien entscheidet ein automatisiertes System über eingestellte Zahlungen an Empfänger:innen von Sozialleistungen und versendet jede Woche rund 50.000 entsprechende Benachrichtigungen. Luke Henriques-Gomes, Australien-Korrespondent bei The Guardian, berichtet über die teils prekären Situationen, in denen die Betroffenen dadurch landen würden. Häufig genügten geringste Versäumnisse, etwa die Nichtteilnahme an einem von der Arbeitsagentur kurzfristig festgelegten Termin, für einen Zahlungsstopp. Problematisch seien laut Henriques-Gomes nicht nur das aggressive Regelwerk des Systems und die Tatsache, dass menschliches Personal bei den Behörden immer weniger Einfluss auf Entscheidungen habe, sondern auch, dass den Betroffenen Ansprechpartner:innen fehlten – gerade dann, wenn eine algorithmische Entscheidung sich als falsch herausstellt (Fehlentscheidungen der Software sorgten sorgten schon vor zwei Jahren für Aufsehen).

Gemäß der Recherche des Guardian seien zwei Gruppen in besonderem Maße negativ von dem System betroffen: Obdachlose und Alleinerziehende.

April 2019: https://www.theverge.com/2019/4/25/18516004/amazon-warehouse-fulfillment-centers-productivity-firing-terminations
- Darstellung 1: https://t3n.de/news/amazon-vollautomatischer-versand-braucht-noch-zeit-automatisierte-kuendigung-funktioniert-schon-1160456/

Da errechnet der Computer laut Medienberichten bereits heute, wer nicht produktiv genug ist, und verwarnt und entlässt automatisiert. Der Vorgesetzte muss nur noch gegenzeichnen, wie das Portal mit diesem Dokument belegt. Laut dem Bericht würden jedes Jahr zahlreiche Mitarbeiter aufgrund mangelnder Effizienz entlassen, wobei die Überwachung und Auswahl mithilfe eines automatisierten Tools erfolge. Einige Mitarbeiter gaben an, dass sie deshalb bereits so weit wie möglich auf Toilettenpausen verzichteten.

- Darstellung 2: https://www.focus.de/finanzen/news/us-bericht-ki-bei-amazon-kuendigt-langsame-mitarbeiter-automatisch_id_10660365.html

Wie das US-Magazins "The Verge" berichtet, setzt der US-Onlineversandhändler einen Algorithmus ein, um die Arbeit seiner Mitarbeiter zu kontrollieren und auszuwerten. Ist die Leistung nicht zufriedenstellend, kann das System die Mitarbeiter sogar feuern. Kündigungen und Abmahnungen verschickt die KI teilweise automatisiert – und ohne vorherige Zustimmung eines Vorgesetzten.

Oktober 2018: https://www.heise.de/newsticker/meldung/Amazon-KI-zur-Bewerbungspruefung-benachteiligte-Frauen-4189356.html
- Amazon: KI zur Bewerbungsprüfung benachteiligte Frauen - Ein automatisches Bewertungssystem von Bewerbungen bei Amazon wurde größtenteils eingestampft, nachdem der US-Konzern mitbekommen hatte, dass die KI Frauen systematisch benachteiligte. Das geht aus einem Bericht der Nachrichtenagentur Reuters hervor. Demnach war seit 2014 intern ein Algorithmus entwickelt worden, der unter mehreren Bewerbungstexten automatisch jene der vielversprechendsten Bewerber herausfiltern sollte.

Exkursion/Gäste in diesem Semester

Thomas Wagner 07.11.2019 AI@exLabIII#Thomas_Wagner
capulcu 14.11.2019 AI@exLabIII#capulcu
Christoph Marischika 05.12.2019 AI@exLabIII#Krieg & KI
Fiffkon 22.-24.11. AI@exLabIII#Exkursion

Projektpräsentation - Verena Lercher

Verena Lercher stellt ihre künstlerische Arbeit vor:

Ross Goodwin on the Road

Not a poet.

Ross Goodwin is an Artist, creative technologist, hacker, gonzo data scientist, writer of writers. Graduate of NYU ITP & MIT; former Obama administration ghostwriter. Employs machine learning, natural language processing, other computational tools to realize new forms & interfaces for written language.

wordcar https://github.com/rossgoodwin/wordcar

Artikel:

Jupyter Notebooks Einführung

Offizielle Dokumentation: https://jupyter-notebook.readthedocs.io/en/stable/index.html

Jupyter ist eine Webapplikation, die das Arbeiten mit sogenannten Jupyter Notebooks ermöglicht. In Jupyter Notebooks kann man neben Code (nicht nur Python) auch formatierten Text, Links, Bilder, Videos und interaktive Widgets generieren, laufen lassen und exportieren. Neben der modernen Jupyter-Umgebung kann man Python auch im klassichen Interface “Editor + Command Line” verwenden.

Markdown Syntax

Markdown hat Ähnlichkeiten mit einer Computersprache, ist aber wesentlich einfacher konzipiert und soll so für jeden verständlich sein. Markdown ermöglicht es, Texte im Web zu formatieren, ohne das betreffende Dokument dazu mit eckigen Klammern, Befehlen und sonstigen Kommandos zu überfluten, wie man sie für ein gestyltes HTML-Dokument normalerweise benötigt.

Am besten zeigen sich die Vorteile von Markdown in einem Praxisbeispiel. Zwei Absätze mit Text und einer Überschrift sollen gestylt werden – der erste kursiv, und der Zweite gefettet. In klassischem HTML müsste man eigentlich folgenden Code verfassen:

<h2>Markdown-Test</h2>
<p><strong>Dieser Text soll fett geschrieben werden.</strong></p>
<p><em>Und dieser Absatz soll kursiv angezeigt werden.</em></p>

In Markdown würde das obere Beispiel wie folgt aussehen:

## Markdown-Test
**Dieser Text soll fett geschrieben werden.**
*Und dieser Absatz soll kursiv angezeigt werden.*

zum Ausprobieren, siehe Notebook in Cloud: Markdown-basics.ipynb

Markdown hilfe:

https://help.github.com/en/articles/basic-writing-and-formatting-syntax

advanced:

https://help.github.com/en/articles/working-with-advanced-formatting

Module nachinstallieren

das Natural Language Toolkit NLTK zu installieren

open conda and type:

conda install nltk

textblob-de installieren

Die Installation von textblob-de erfolgt in zwei Schritten.

1.Terminal start & type:

pip install -U textblob-de

„-U“ sorgt dafür, dass alle notwendigen Abhängigkeiten auf die neueste Version gebracht werden.

2. Sprachmodelle und Sprachdaten aus dem Natural Language Toolkit (NLTK) hinzufügen:

python3 -m textblob.download_corpora

Stimmungsanalyse

Sentiment Detection (auch Sentimentanalyse, englisch für „Stimmungserkennung“) ist ein Untergebiet des Text Mining und bezeichnet die automatische Auswertung von Texten mit dem Ziel, eine geäußerte Haltung als positiv oder negativ zu erkennen.

see: https://de.wikipedia.org/wiki/Sentiment_Detection#Einf%C3%BChrung

textblob

TextBlob ist ein Tool für natural language processing (NLP) mit Python.

Mit Textblob sind viele Ansätze wie etwa Erkennen von Wortarten, Extraktion von Substantiven, Stimmungsanalyse und auch Klassifizierungen möglich.

textblob in short

pip install textblob

---

from textblob import TextBlob

---

textsnippet = TextBlob('not a very great experiment')

---

print(textsnippet.sentiment)

Vorverarbeitung von Texten

Wir benutzen hierzu

die gängigen Python-Tools
NltK, das Natural Language Toolkit
textblob-de

Tokenization

type @lindner lol, that was #awesome :) in: https://text-processing.com/demo/tokenize/

Whitespace Tokenizer in Python

Mit der Python-Funktion Split() können wir einen Text leicht aufteilen. In vielen Fällen machen wir dann aber Fehler. Es fängst schon damit an, dass Satzzeichen am vorangehende Wort geschrieben werden, aber nicht dazu gehören, es sei denn, das Wort ist eine Abkürzung oder eine Ordinalzahl, aber letzteres nur im Deutschen...

splitten mit python (whitespace):

token_WS=gedicht1.split() 
print(token_WS)

Treebank Tokenizer mit NLTK

Im nächsten Beispiel sehen wir, wie man mit Python und NLTK eine Zeichenkette in eine Liste von Wörtern aufteilen kann. Wir finden nicht nur Wörter, sondern auch Satzzeichen, Zahlen und Symbole. Der Sammelbegriff für diese Einheiten ist Token. Das Zerlegen einer Zeichenkette in Tokens wird daher Tokenisierung oder auf Engslisch Tokenization genannt.

#from nltk.tokenize import TreebankWordTokenizer
from nltk import word_tokenize

---

# satz by word separieren
tokened_W=word_tokenize(gedicht1, language='german')
print(tokened_W)

---

tweet = "@lindner lol, that was #awesome :)"
tokened_tweet=word_tokenize(tweet, language='english')
print(tokened_tweet)

oder mit textblob-de...

from textblob_de import Word
from textblob_de import TextBlobDE as TextBlob

---

tokened_blob_W=TextBlob(gedicht1)
print(tokened_blob_W)
print(tokened_blob_W.words)

Stemming & Lemmatization

In vielen Sprachen, wie auch im Deutschen und Englischen, können Wöter in verschiedenen Formen auftreten. (Es gibt auch Sprachen, in denen das nicht der Fall ist. Diese Sprachen werden isolierende Sprachen genannt. Beispiele hierfür sind Mandarin (Chinesisch) und Vietnamesisch)). Oft ist es wichtig, den Grundfom eines Wortes, das im Text in flektierter Form vorkommt, zu bestimmen. Es ist wichtig, dass wir hie drei Begriffe klar trennen:

Lemma - Die Form des Wortes, wie sie in einem Wörterbuch steht. Z.B.: Haus, laufen, begründen
Stamm - Das Wort ohne Flexionsendungen (Prefixe und Suiffixe). Z.B.: Haus, lauf, begründ
Wurzel - Kern des Wortes, von dem das Wort ggf. durch Derivation abgeleitet wurde. Z.B.: Haus, lauf, Grund

Wir unterscheiden jetzt Stemmer, Programme, die den Stamm eines Wortes suchen, und Lemmatisierer, die das Lemma für jedes Wort suchen.

https://text-processing.com/demo/stem/

tokened_blob_W.words.lemmatize()

erste Schritte mit Python

Variablen setzen

var_string = "null"
var_int = 0

Ausgaben mit print()

print(var_int)

print("Hallo Welt")

Eingaben mit input()

Text:

input("is EKI in the house? type true for 1 or false for 0:")

Ganzzahl:

int(input("is EKI in the house? type 1 for true or 0 for false:"))

Fließkommazahl:

float(input("is EKI in the house? type 1.0 for true or 0.0 for false:"))

Kontrollstrukturen

if_Anweisung:

if EKI > 1:
     print("true")
else:
     print("false")

siehe auch: Übersicht von Vergleichsoperatoren

Kommentare

Einzeiliges Kommentar

# mit dem Hashtag zu Beginn einer Zeile wird auskommentiert

mehrzeilige Kommentare:

"""In 3 Anführungszeichen
können mehrzeilige Kommentare (__doc__strings)
verfasst werden"""

Python Tutorials

Onlinetutorial:

Python tutorial der djangogirls (Deutsch)

Book:

Das Python3.3-Tutorial (Deutsch)

Videotutorial:

Videotutorial von »Coding is for girls« (Englisch)

Hands-on Tutroial:

an hour of Code - A Visual Introduction to Python

Maschinelles Dichten

Aus exmediawiki

Version vom 31. Oktober 2019, 00:43 Uhr von C.heck (Diskussion | Beiträge) (→‎Ausgaben mit print())
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

Inhaltsverzeichnis

KHM-Wolke

Vorstellungsrunde

Exkursion/Gäste in diesem Semester

Projektpräsentation - Verena Lercher

Ross Goodwin on the Road

Jupyter Notebooks Einführung

Markdown Syntax

Module nachinstallieren

das Natural Language Toolkit NLTK zu installieren

textblob-de installieren

Stimmungsanalyse

textblob

textblob in short

Vorverarbeitung von Texten

Tokenization

Whitespace Tokenizer in Python

Treebank Tokenizer mit NLTK

oder mit textblob-de...

Stemming & Lemmatization

erste Schritte mit Python

Variablen setzen

Ausgaben mit print()

Eingaben mit input()

Kontrollstrukturen

Kommentare

Python Tutorials

Maschinelles Dichten

Aus exmediawiki

Version vom 31. Oktober 2019, 00:43 Uhr von C.heck (Diskussion | Beiträge) (→‎Ausgaben mit print())(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

Inhaltsverzeichnis

KHM-Wolke

Vorstellungsrunde

Exkursion/Gäste in diesem Semester

Projektpräsentation - Verena Lercher

Ross Goodwin on the Road

Jupyter Notebooks Einführung

Markdown Syntax

Module nachinstallieren

das Natural Language Toolkit NLTK zu installieren

textblob-de installieren

Stimmungsanalyse

textblob

textblob in short

Vorverarbeitung von Texten

Tokenization

Whitespace Tokenizer in Python

Treebank Tokenizer mit NLTK

oder mit textblob-de...

Stemming & Lemmatization

erste Schritte mit Python

Variablen setzen

Ausgaben mit print()

Eingaben mit input()

Kontrollstrukturen

Kommentare

Python Tutorials

Version vom 31. Oktober 2019, 00:43 Uhr von C.heck (Diskussion | Beiträge) (→‎Ausgaben mit print())
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)