Update: Prototyp ist online: http://dimidev.pythonanywhere.com/

Diese Webseite dient dazu die Listings von Immobilienscout anzuzeigen und Bewertungen mit Hilfe von Machine Learning zu erzeugen. Die tabellarische Ansicht hilft dem Nutzer nur die relevante Informationen zusammengefasst zu sehen.

Zur Nutzung: man gibt eine Adresse und einen Radius ein. Danach werden Daten Live aus Immobilienscout24 übertragen und mit prozessiert. Daten und Auswertungen sind in der tabellarischen Form zu sehen. Mit dem Klick auf einen Eintrag kommt man zum Immobilienscout Angebot.

In diesem Projekt werden die Ideen aus dem Post Immobilie Profitabilität Berechnen und Immobilienscout24 Web Scraper – Holt euch eure Daten genutzt, um eine integrierte Umgebung zu schaffen. Ziel der Webseite ist es, einem Privatanleger übersichtlich darzustellen, welche Wohnungen bei Immobilienscout24 zum Verkauf stehen, und welches Kapital er benötigt, um diese zu erwerben.

Dazu werden mehre neue Tools eingesetzt. Man braucht eine Crawler-Umgebung für die Daten, eine Datenbank-Umgebung für die Speicherung und eine Web-Umgebung für die Darstellung. Dies soll in einen laufenden Server installiert werden, um die Daten regelmäßig abzurufen, sie in einer Datenbank zu speichern, und übersichtlich darzustellen.

Die bisherigen Tools basieren auf Python Programmierung.

  • Scrapy – Ein Open-Source- und kollaboratives Framework zur Extraktion der benötigten Daten von Webseiten.
  • SQlite Database – C-Sprachenbibliothek, die eine kleine, schnelle, eigenständige, hochzuverlässige, voll funktionsfähige SQL-Datenbankmaschine implementiert.
  • Django – hochrangiges Python Web-Framework, das eine schnelle Entwicklung und ein sauberes, pragmatisches Design fördert. Von erfahrenen Entwicklern entwickelt, erleichtert es einen Großteil der Webentwicklung, sodass man sich auf das Schreiben der App konzentrieren kann. Es ist kostenlos und open source.

Um mit Scrapy zu starten habe ich in Github geschaut was in der open source Entwicklung schon existiert, und habe asmaier/ImmoSpider als Startprojekt gewählt. Auch eine gute Ressource https://github.com/balzer82/immoscraper.

Die Architektur sieht bisher wie folgt aus:

Suchseite Darstellung der Immobilien:

Link Handling: http://127.0.0.1:8000/immoscout/?adr=Dortmund&rds=3&pg=1 – Post StackOverflow Post