Sprachtechnologie in den Digital Humanities

Product type

Sprachtechnologie in den Digital Humanities

Coursera (CC)
Logo Coursera (CC)
Provider rating: starstarstarstar_halfstar_border 7.2 Coursera (CC) has an average rating of 7.2 (out of 6 reviews)

Need more information? Get more details on the site of the provider.

Description

When you enroll for courses through Coursera you get to choose for a paid plan or for a free plan

  • Free plan: No certicification and/or audit only. You will have access to all course materials except graded items.
  • Paid plan: Commit to earning a Certificate—it's a trusted, shareable way to showcase your new skills.

About this course: Sie möchten wissen, was genau die Digitalisierung von Texten beinhaltet? Sie haben sich schon immer gefragt, wie Texte in einem Korpus optimal durchsuchbar gemacht werden? Sie wundern sich, wie Texte mit linguistischen Informationen angereichert werden können? Dann sind Sie in diesem Kurs genau richtig!! Er bietet einen Überblick über die wichtigsten Konzepte und Probleme bei der Digitalisierung und Annotation von geschriebenen Texten. In sechs thematischen Modulen verteilt auf sechs Wochen lernen Sie relevante Technologien und Werkzeuge kennen. Jedes Modul beinhaltet zwei bis drei Videos (10-20 Minuten), ein Quiz oder ein Peer-Assessment sowie kurze Hintergrundtexte …

Read the complete description

Frequently asked questions

There are no frequently asked questions yet. If you have any more questions or need help, contact our customer service.

Didn't find what you were looking for? See also: Humanities, Business Information Systems, General Studies, Ethics, and International Relations.

When you enroll for courses through Coursera you get to choose for a paid plan or for a free plan

  • Free plan: No certicification and/or audit only. You will have access to all course materials except graded items.
  • Paid plan: Commit to earning a Certificate—it's a trusted, shareable way to showcase your new skills.

About this course: Sie möchten wissen, was genau die Digitalisierung von Texten beinhaltet? Sie haben sich schon immer gefragt, wie Texte in einem Korpus optimal durchsuchbar gemacht werden? Sie wundern sich, wie Texte mit linguistischen Informationen angereichert werden können? Dann sind Sie in diesem Kurs genau richtig!! Er bietet einen Überblick über die wichtigsten Konzepte und Probleme bei der Digitalisierung und Annotation von geschriebenen Texten. In sechs thematischen Modulen verteilt auf sechs Wochen lernen Sie relevante Technologien und Werkzeuge kennen. Jedes Modul beinhaltet zwei bis drei Videos (10-20 Minuten), ein Quiz oder ein Peer-Assessment sowie kurze Hintergrundtexte und weiterführende Links zu ausgewählten Themen. Für wen ist dieser Kurs interessant: Dieser Kurs richtet sich an Korpuslinguist/-innen, an Geisteswissenschaftler/-innen und Sprachinteressierte, die von einer rein sprachwissenschaftlichen Perspektive ausgehend auch ein paar Schritte in die Welt der Digitalisierung von Texten wagen und die dahinterstehenden Technologien kennenlernen möchten. Für diesen Kurs brauchen Sie keine Programmierkenntnisse. Mit Interesse an der Digitalisierung und Annotation von Texten sind Sie bestens gerüstet für diesen Kurs. Wir freuen uns, mit Ihnen diese digitalen Wege zu beschreiten, die in den Geisteswissenschaften immer wichtiger werden.

Created by:  University of Zurich
  • Taught by:  Martin Volk, Prof. Dr.

    Institute of Computational Linguistics
  • Taught by:  Noah Bubenhofer, Dr.

    Institute of Computational Linguistics
  • Taught by:  Simon Clematide, Dr. phil.

    Institute of Computational Linguistics
Level Beginner Commitment 2 - 3 h/Woche, insg. 6 Wochen Language German How To Pass Pass all graded assignments to complete the course. Coursework

Each course is like an interactive textbook, featuring pre-recorded videos, quizzes and projects.

Help from your peers

Connect with thousands of other learners and debate ideas, discuss course material, and get help mastering concepts.

Certificates

Earn official recognition for your work, and share your success with friends, colleagues, and employers.

University of Zurich Founded in 1833, the University of Zurich (UZH) is Switzerland’s largest university, with a cur­rent enrollment of over 26,000 students. Made up of seven faculties covering approximately 100 different subject areas, UZH is proud to offer the most comprehensive aca­demic program in the country.

Syllabus


WEEK 1


Woche 1 - Wege in die digitale Welt



In der ersten Woche werden wir darüber sprechen, wie Texte digitalisiert und zum Beispiel in XML dargestellt werden können und was OCR (optical character recognition) für die Anwendung in der Praxis bedeutet. Wir befassen uns außerdem mit der Erstellung von Korpora und den Schwierigkeiten, denen wir dabei begegnen können. Viel Spaß!


3 videos, 4 readings expand


  1. Discussion Prompt: Herzlich Willkommen zum MOOC!
  2. Reading: Die Dozenten dieses MOOC's
  3. Reading: Guidelines zur Bearbeitung des MOOCs
  4. Reading: Lernziele Modul 1
  5. Video: 1.1 - Wege in die digitale Welt
  6. Video: 1.2 - Herausforderungen bei der Korpusakquisition
  7. Video: 1.3 - Digitalisierungszentrum ZB
  8. Reading: Material Modul 1

Graded: Was wissen Sie bereits zum Thema Digitalisierung?
Graded: Testen Sie Ihr Wissen zum Thema Korpusakquisition

WEEK 2


Woche 2 - Strukturierte und nachhaltige Repräsentation von Korpusdaten



In der zweiten Woche beschäftigen wir uns mit der strukturierten und nachhaltigen Repräsentation von Korpusdaten. Wir werden über die Markup Language XML sprechen und einige wichtige Standards zur Textrepräsentation kennenlernen. In der zweiten Hälfte dieses Moduls geht es anschließend um das Thema der automatischen Text- und Wortsegmentierung. Viel Spaß mit den Videos!


2 videos, 3 readings expand


  1. Reading: Lernziele Modul 2
  2. Video: 2.1 - XML-Standards zur Textrepräsentation
  3. Reading: Einführungstext XML: Strukturierte und nachhaltige Repräsentation von Korpusdaten
  4. Video: 2.2 - Textsegmentierung
  5. Discussion Prompt: Wohlgeformtheit eines XML-Dokuments
  6. Reading: Material Modul 2

Graded: XML und TEI P5: Wie viel wissen Sie bereits?
Graded: Testen Sie Ihr Wissen zum Thema Textsegmentierung

WEEK 3


Woche 3 - Eigenschaften von Korpora und grundlegende Analysemethoden



In der dritten Woche geht es um die wichtigsten Eigenschaften von Korpora, um grundlegende Analysemethoden in der Korpuslinguistik und Grundbegriffe wie Worthäufigkeiten, Kollokationen, N-Gramme. Im letzten Teil wird Ihnen Noah Bubenhofer noch einen Ausblick auf die visuelle und graphische Darstellung von Texteigenschaften geben. Viel Spaß!


3 videos, 3 readings expand


  1. Reading: Lernziele Modul 3
  2. Video: 3.1 - Eigenschaften von Korpora und Analysemethoden
  3. Video: 3.2 - Hands-on Korpusanalysen
  4. Video: 3.3 - Visualisierung und graphische Darstellung
  5. Reading: Visuelle Bergtour durch ein Kollokationsnetz
  6. Reading: Material Modul 3

Graded: Theorie: Grundbegriffe der Korpuslinguistik
Graded: Praxis: Korpusabfragen und Analysemethoden
Graded: Korpusrecherche

WEEK 4


Woche 4 - Automatische Korpusannotation mit computerlinguistischen Werkzeugen



In diesem Modul geht es um die automatische Korpus-Annotation mit linguistischen Informationen wie Part-Of-Speech-Tags (Wortarten) und Lemmas (Grundformen), aber auch um die Schwierigkeiten, die eine solche automatische Annotation mit sich bringen kann. Wir werden besprechen, wie die automatische Erkennung von Eigennamen oder geographischen Namen (Named Entities) abläuft und im dritten Teil noch auf die automatische Syntax-Analyse von Texten eingehen. Viel Spaß!


3 videos, 3 readings expand


  1. Reading: Lernziele Modul 4
  2. Video: 4.1 - Bestimmung von Wortarten und Grundformen
  3. Video: 4.2 - Erkennung, Klassifikation und Linking von Named Entities
  4. Reading: Named Entities in der Praxis
  5. Video: 4.3 - Syntaktische Analyse
  6. Discussion Prompt: Parsing: Was ist das eigentlich?
  7. Reading: Material Modul 4

Graded: Wortarten- und Grundformen automatisch bestimmen
Graded: Testen Sie Ihr Wissen zu NER und Syntaxanalyse

WEEK 5


Woche 5 - Manuelle Annotation und Evaluation von Korpusdaten



In Modul 5 beschäftigen wir uns mit der Frage, wie eine möglichst ökonomische Annotation aussehen kann und wie sich manuelle und automatische Annotation mit Hilfe von maschinellem Lernen ergänzen können. Wir besprechen außerdem, wie wir die Qualität bzw. die Genauigkeit der Annotation gewährleisten und evaluieren können. Im zweiten Teil geht es dann um das sogenannte "Crowdsourcing", wo über Online-Plattformen Daten für diverse Projekte gesammelt bzw. korrigiert werden. Viel Spaß in der vorletzten Woche!


2 videos, 3 readings expand


  1. Reading: Lernziele Modul 5
  2. Video: 5.1 - Manuelle Annotation und Evaluation
  3. Reading: Evaluationsmaße: Wie gut funktioniert unser Modell?
  4. Discussion Prompt: Persönliche Erfahrungen mit Crowdsourcing
  5. Video: 5.2 - Möglichkeiten und Probleme beim Crowdsourcing
  6. Reading: Material Modul 5

Graded: Evaluation von NER-Tagging

WEEK 6


Woche 6 - Herausforderungen der Multilingualen Textanalyse



Im letzten Modul befassen wir uns mit multilingualen bzw. parallelen Korpora. Im ersten Teil geht es um die automatische Sprach-Identifikation in gemischtsprachlichen Korpora, die einen wichtigen Schritt bei der Verarbeitung der Texte darstellt. Im zweiten Teil geht es um die automatische Satz- bzw. Wortalignierung zwischen parallelen Texten in unterschiedlichen Sprachen. Viel Spaß in der letzten Woche!


2 videos, 3 readings expand


  1. Reading: Lernziele Modul 6
  2. Video: 6.1 - Automatische Sprachidentifikation
  3. Reading: Vom Babelfisch zur maschinellen Übersetzung
  4. Video: 6.2 - Sprachübergreifende Alignierung
  5. Reading: Material Modul 6
  6. Discussion Prompt: Feedback und Dankeschön!

Graded: Fast geschafft: Sprachidentifikation & Alignierung
There are no reviews yet.

Share your review

Do you have experience with this course? Submit your review and help other people make the right choice. As a thank you for your effort we will donate £1.- to Stichting Edukans.

There are no frequently asked questions yet. If you have any more questions or need help, contact our customer service.