Themen des Proseminars “Active Learning”

Wintersemester 2014/2015, Institut für Informatik, Universität Heidelberg

Link zur Seminarseite: http://pvs.ifi.uni-heidelberg.de/teaching/ws2014/ps-active-learning/

Teilnehmer

Vorname	Nachname	Thema	Block	Datum	Vorbesprechung	Ausarb.
Andreas	Widmann	A1	A	23.11.	14.11., 13:15
Julian	Gerhard	A2	A	23.11.	13.11., 10:00
Martin	Enderlein	A3	A	23.11.	18.11., 13:30
Thomas	Wangler	A4	A	23.11.	18.11., 10:00
Dominik	Fay	B1	B	07.12.	02.12., 13:00
Robert	Hajok	B4	B	07.12.	01.12., 10:00
Paul	Zubrod	B5	B	07.12.
Oliver	Müller	B7	B	07.12.	01.12., 13:00
Jonas	Massa	B8	B	07.12.	03.12., 15:00

Teilnehmer

A. Einführung zu Active Learning

A1 Überwachtes Maschinelles Lernen / Klassifikation

A2 Support vector machines (SVMs), Entscheidungsbäume

A3 Active Learning, Teil I: Einführung

A4 Active Learning, Teil II: Weitere Aspekte

B. Anwendungen von Active Learning

B1 Krebsdiagnose

B2 Stoppkriterien beim Lernen von Named Entity Recognition

B3 Lernen von Parametern für Record Matching

B4 Computergestützte Medikamententdeckung

B5 Software Testing von kommerziellen Spielen

B6 Automatische Spracherkennung

B7 Interaktionsmodelle für das Lernen durch Roboter

B8 Tagging von Musik als online-Spiel

B9 Automatische Experimente durch einen Wissenschaftsroboter

A. Einführung zu Active Learning

Allgemeine Literatur:

Settles, Burr. "Active learning." Synthesis Lectures on Artificial Intelligence and Machine Learning 6.1 (2012): 1-114. link

Gertz, Michael. “Knowledge Discovery in Databases” Slides from lecture in WS 13/14 link

A1 Überwachtes Maschinelles Lernen / Klassifikation

Was ist Machine Learning?
Was ist überwachtes Lernen? Was ist Klassifikation?
Was ist Training, was Test? Wozu braucht man beides?
Separierbarkeit: Kann mein Modell die gesehenen Daten perfekt trennen?
Entscheidungsbäume, C4.5

Konstruktion, Split-Kriterien
Separierbarkeit bei Entscheidungsbäumen
Pruning gegen Overfitting

Overfitting: Sollte mein Modell die gesehenen Daten so gut wie möglich trennen?
Wie misst man die Güte eines Klassifikationsmodells?
Ideale Voraussetzung: KDD

A2 Support vector machines (SVMs)

Support Vector machines (SVMs)

Cristianini, Nello, and John Shawe-Taylor. An introduction to support vector machines and other kernel-based learning methods. Cambridge university press, 2000. UB
Schohn, Greg, and David Cohn. "Less is more: Active learning with support vector machines." ICML. 2000. link
Beschreibung des Modells
Berechnung / Lernen
Separierbarkeit bei SVMs

Soft Margin
Kernel, Feature Space

Query-Strategie für SVMs

siehe Settles, S.22-24

Ideale Voraussetzung: KDD

A3 Active Learning, Teil I: Einführung

Grundsätzliche Iteration: Active learning, Kapitel 1.1, 1.2

Lernen eines Modells
Klassifizieren / vorhersagen
Anfrage (query) machen (pool-basiert)

Query frameworks

Uncertainty sampling: Active learning, Kapitel 2.1, 2.2, 2.3
Version space reduction:

Query by disagreement (QBD)
Query by committee (QBC)

Vergleich: Active learning, Kapitel 7.1

A4 Active Learning, Teil II: Weitere Aspekte

Initialisierung, “cold start problem”

Attenberg, Josh, and Foster Provost. "Inactive learning?: difficulties employing active learning in practice." ACM SIGKDD Explorations Newsletter 12.2 (2011): 36-41. link, Section 6

Alternativen zu pool-basiertem Sampling: Active learning, Kapitel 1.3

query-Synthese
stream-basiert
Vorteile und Nachteile
Anforderung für query-Synthese

Wann kann man query-Synthese sinnvoll einsetzen?
Wann kann query-Synthese unsinnvolle Ergebnisse liefern?

Alternative Anfrage-Typen: Active learning, Kapitel 7.3
Stoppen: Active learning, Kapitel 7.8

B. Anwendungen von Active Learning

B1 Krebsdiagnose

Liu, Ying. "Active learning with support vector machine applied to gene expression data for cancer classification." Journal of chemical information and computer sciences 44.6 (2004): 1936-1941. link

B2 Stoppkriterien beim Lernen von Named Entity Recognition

Laws, Florian, and Hinrich Schätze. "Stopping criteria for active learning of named entity recognition." Proceedings of the 22nd International Conference on Computational Linguistics-Volume 1. Association for Computational Linguistics, 2008. link

B3 Lernen von Parametern für Record Matching

B4 Computergestützte Medikamententdeckung

Warmuth, Manfred K., et al. "Active learning with support vector machines in the drug discovery process." Journal of Chemical Information and Computer Sciences 43.2 (2003): 667-673. link

B5 Software Testing von kommerziellen Spielen

Xiao, Gang, et al. "Software testing by active learning for commercial games." Proceedings of the National Conference on Artificial Intelligence. Vol. 20. No. 2. Menlo Park, CA; Cambridge, MA; London; AAAI Press; MIT Press; 1999, 2005. link

B6 Automatische Spracherkennung

Riccardi, Giuseppe, and Dilek Hakkani-Tur. "Active learning: Theory and applications to automatic speech recognition." Speech and Audio Processing, IEEE Transactions on 13.4 (2005): 504-511. link

B7 Interaktionsmodelle für das Lernen durch Roboter

Cakmak, Maya, Crystal Chao, and Andrea L. Thomaz. "Designing interactions for robot active learners." Autonomous Mental Development, IEEE Transactions on 2.2 (2010): 108-118. link
M. Cakmak and A.L. Thomaz. “Mixed-Initiative Active Learning”. International Conference on Machine Learning - Workshop on Combining Learning Strategies to Reduce Label Cost, 2011. link
Was ist der konzeptionelle Unterschied zwischen Learning und Teaching?
Welche Vor- und Nachteile ergeben sich aus Teaching im Vergleich zu Learning?

B8 Tagging von Musik als online-Spiel

Barrington, Luke, Douglas Turnbull, and Gert Lanckriet. "Game-powered machine learning." Proceedings of the National Academy of Sciences 109.17 (2012): 6411-6416. link
crowdsourcing

B9 Automatische Experimente durch einen Wissenschaftsroboter

King, Ross D., et al. "Functional genomic hypothesis generation and experimentation by a robot scientist." Nature 427.6971 (2004): 247-252. link