HTML Seite Parsen

  • Antworten:2
Gelöschter Account
  • Forum-Beiträge: 86

24.12.2013, 03:38:44 via Website

Hey,

ich würde gerne meine Vertretungsplan App umändern und nicht mehr nur den Tabellenframe des Vertretungsplanes laden, sondern die Tabelle parsen und "schön" darstellen in meiner App.

Mein Problem ist die "unschöne" Programmierung des Vertretungsplanes, denn alle tr und td Elemente sind ohne ID, sodass ich nicht wirklich einen Anfangs und Endpunkt habe um z.b. die 3. und 4. Stunde am Montag abzufragen.

Hier mal der Link:
http://vplan.jobelmann-schule.de/Schueler/51/c/c00059.htm

Ich möchte nur den Inhalt des Vertretungsplanes, nicht den Inhalt des grauen Kastens darunter.
Wie würdet ihr vorgehen um da die Daten ordentlich raus zu parsen?

Gruß
Phillipp

Antworten
deeprojects
  • Forum-Beiträge: 35

24.12.2013, 07:51:13 via Website

Hi,
ändert sich denn die Struktur der HTML Seite oder wird diese immer gleich bleiben ?
Wenn sie sich nämlich nicht verändert kannst das mit der HTMLUnit in Java parsen da kannst du auf html tags prüfen.
Hier mal der Link http://htmlunit.sourceforge.net/

Viel Spaß ;)

Antworten
Gelöschter Account
  • Forum-Beiträge: 86

24.12.2013, 08:21:56 via Website

Sollte eigentlich gleich bleiben, bis auf feiertagsmeldungen, wie jetzt. Hätten die einzelnen tr und td's wenigstens ID's dann könnte ich sagen, dass ich den inhalt zwischen <td id="montag-3stunde"> und </td> haben will.

ich guck mir deinen link gleich mal an.

Antworten