| Autor |
Nachricht |
daddeldu
Unregistrierter
|
daddeldu Unregistrierter
22:03:02 30.08.2010 Titel: |
algorythmus gesucht bzw. evtl. ein Tipp |
Zitieren |
Servus.
Ich möchte bei meinen Script versuchen, automatisiert Websites zu kategorisieren.
Wie würdet ihr das realisieren?
Mir fällt bisher nur eine mühsame Lösung ein:
Für jede Kategorie endlos viele Stichwörter definieren (z.B. Sport: Fussball, Handball, Ergebnis, Bundesliga etc.
Programmierung: Python, PHP, C++, Webframework etc.
....)
und dann prüfen, ob die ein dieser Wörter im Quelltext finden und denn dementsprechend die Kategorie wählen.
Wenn er nichts finden -> Sonstiges
Habt ihr nen besseren Weg im Kopf ? |
|
|
|
 |
MaBa
Mitglied
Benutzerprofil
Anmeldungsdatum: 28.04.2010
Beiträge: 93
|
MaBa Mitglied
08:32:40 31.08.2010 Titel: |
|
Zitieren |
Hallo daddeldu,
würde es nicht ausreichen die keywords zu untersuchen?
| Code: | | <meta name="keywords" content="Bundesliga, C++, ...">
| |
| Code: | | <meta name="keywords" content="Bundesliga, C++, ...">
| |
| Code: | | <meta name="keywords" content="Bundesliga, C++, ...">
| |
Viele Grüße,
MaBa |
_________________ Dipl.-Inform. Markus Barth
Fachhochschule Trier
Umwelt-Campus Birkenfeld
|
|
 |
rage_quit
Mitglied
Benutzerprofil
Anmeldungsdatum: 15.07.2010
Beiträge: 245
|
rage_quit Mitglied
09:47:12 31.08.2010 Titel: |
|
Zitieren |
| MaBa schrieb: | Hallo daddeldu,
würde es nicht ausreichen die keywords zu untersuchen?
| Code: | | <meta name="keywords" content="Bundesliga, C++, ...">
| |
| Code: | | <meta name="keywords" content="Bundesliga, C++, ...">
| |
| Code: | | <meta name="keywords" content="Bundesliga, C++, ...">
| |
Viele Grüße,
MaBa | alter, wer hat dir eigentlich dein diplom verliehen |
_________________ People who ragequit often do so because they believe that their team has no chance of success
|
|
 |
daddeldu
Unregistrierter
|
daddeldu Unregistrierter
10:23:30 31.08.2010 Titel: |
|
Zitieren |
naja dafür gibt es leider viel zu viele Seiten, die dieses Metatag nicht verwenden. |
|
|
|
 |
MaBa
Mitglied
Benutzerprofil
Anmeldungsdatum: 28.04.2010
Beiträge: 93
|
MaBa Mitglied
14:16:27 31.08.2010 Titel: |
|
Zitieren |
Hallo daddeldu,
kommt darauf an welche Seiten du analysieren willst. Ich behaupte einfach mal, dass offizielle Seiten durchaus konsequent keywords angeben. Auch Suchmaschinen lesen die keywords aus und gewichten damit das Ranking. Google macht natürlich alles anders, aber Webmaster orientieren sich ja nicht nur an einer Suchmaschine.
Auch wenn du eine Website durch einen online-Dienst bewerten lässt (z.B. seitwert.de) ist die Anzahl der keywords ein Kriterium zur Bewertung der Seite.
Natürlich kann man auch den sichtbaren Seiteninhalt durchsuchen, aber ich mag bezweifeln, dass die Trefferquote beim Kategorisieren höher ist, als beim Analyisieren der Keywords. Schließlich müsstest du die Wörter zählen (wobei hier der Sinn der Wörter nicht erkannt wird!) und ob auf einer Fußball-Seite das Wort "Fußball" oft genug fällt, um es in der entsprechenden Kategorie einzuordnen, halte ich für eine gewagte Theorie.
rage_quit hat bestimmt einen besseren Vorschlag für dich ;-)
Viele Grüße,
MaBa |
_________________ Dipl.-Inform. Markus Barth
Fachhochschule Trier
Umwelt-Campus Birkenfeld
|
|
 |
daddeldu
Unregistrierter
|
daddeldu Unregistrierter
15:05:57 31.08.2010 Titel: |
|
Zitieren |
Danke
Man noch versuchen ausm <title> abzuleiten und ansonsten wird es |
|
|
|
 |
rage_qu1t
Unregistrierter
|
rage_qu1t Unregistrierter
18:09:06 31.08.2010 Titel: |
|
Zitieren |
| MaBa schrieb: | | rage_quit hat bestimmt einen besseren Vorschlag für dich ;-) | na klar nimm nen aktuellen browser (firefox) dann kannst auch reine js seiten in deinen index aufnehmen
faken kann man nur das nicht was der user real auf dem bildschirm sieht daher werden seit jahren keywords eigentlich nicht mehr fürs ranking verwendet;) |
|
|
|
 |
rage_qu1t
Unregistrierter
|
rage_qu1t Unregistrierter
18:12:31 31.08.2010 Titel: |
|
Zitieren |
|
 |