Hypercell ein ] Hypercell aus ] Zeige Navigation ] Verstecke Navigation ]
c++.de  
   
Forentreff 2012     
Bücher-Shop mit Amazon (Buchkategorien)C++ : Referenzen zu C++ : C++ Builder : Visual C++ : C# : Java : Spieleprogrammierung : Systemprogrammierung Linux : Software-Entwicklung : .NET : Compilertechnik : Algorithmen & Datenstrukturen : Objektorientierung : Entwurfsmuster : UML : eXtreme Programming : Scrum : Projektmanagement : Software-Testing : Datenbanken : Tom DeMarco : Dilbert : User Friendly
C/C++ Forum :: Webzeugs ::  algorythmus gesucht bzw. evtl. ein Tipp     Zeige alle Beiträge auf einer Seite Auf Beitrag antworten
Autor Nachricht
daddeldu
Unregistrierter




Beitrag daddeldu Unregistrierter 22:03:02 30.08.2010   Titel:   algorythmus gesucht bzw. evtl. ein Tipp            Zitieren

Servus.
Ich möchte bei meinen Script versuchen, automatisiert Websites zu kategorisieren.
Wie würdet ihr das realisieren?

Mir fällt bisher nur eine mühsame Lösung ein:
Für jede Kategorie endlos viele Stichwörter definieren (z.B. Sport: Fussball, Handball, Ergebnis, Bundesliga etc.

Programmierung: Python, PHP, C++, Webframework etc.

....)
und dann prüfen, ob die ein dieser Wörter im Quelltext finden und denn dementsprechend die Kategorie wählen.
Wenn er nichts finden -> Sonstiges



Habt ihr nen besseren Weg im Kopf ?
MaBa
Mitglied

Benutzerprofil
Anmeldungsdatum: 28.04.2010
Beiträge: 93
Beitrag MaBa Mitglied 08:32:40 31.08.2010   Titel:              Zitieren

Hallo daddeldu,

würde es nicht ausreichen die keywords zu untersuchen?

Code:
<meta name="keywords" content="Bundesliga, C++, ...">
Code:
<meta name="keywords" content="Bundesliga, C++, ...">
Code:
<meta name="keywords" content="Bundesliga, C++, ...">


Viele Grüße,
MaBa

_________________
Dipl.-Inform. Markus Barth
Fachhochschule Trier
Umwelt-Campus Birkenfeld
rage_quit
Mitglied

Benutzerprofil
Anmeldungsdatum: 15.07.2010
Beiträge: 245
Beitrag rage_quit Mitglied 09:47:12 31.08.2010   Titel:              Zitieren

MaBa schrieb:
Hallo daddeldu,

würde es nicht ausreichen die keywords zu untersuchen?

Code:
<meta name="keywords" content="Bundesliga, C++, ...">
Code:
<meta name="keywords" content="Bundesliga, C++, ...">
Code:
<meta name="keywords" content="Bundesliga, C++, ...">


Viele Grüße,
MaBa
alter, wer hat dir eigentlich dein diplom verliehen :rolleyes:

_________________
People who ragequit often do so because they believe that their team has no chance of success
daddeldu
Unregistrierter




Beitrag daddeldu Unregistrierter 10:23:30 31.08.2010   Titel:              Zitieren

naja dafür gibt es leider viel zu viele Seiten, die dieses Metatag nicht verwenden.
MaBa
Mitglied

Benutzerprofil
Anmeldungsdatum: 28.04.2010
Beiträge: 93
Beitrag MaBa Mitglied 14:16:27 31.08.2010   Titel:              Zitieren

Hallo daddeldu,

kommt darauf an welche Seiten du analysieren willst. Ich behaupte einfach mal, dass offizielle Seiten durchaus konsequent keywords angeben. Auch Suchmaschinen lesen die keywords aus und gewichten damit das Ranking. Google macht natürlich alles anders, aber Webmaster orientieren sich ja nicht nur an einer Suchmaschine.

Auch wenn du eine Website durch einen online-Dienst bewerten lässt (z.B. seitwert.de) ist die Anzahl der keywords ein Kriterium zur Bewertung der Seite.

Natürlich kann man auch den sichtbaren Seiteninhalt durchsuchen, aber ich mag bezweifeln, dass die Trefferquote beim Kategorisieren höher ist, als beim Analyisieren der Keywords. Schließlich müsstest du die Wörter zählen (wobei hier der Sinn der Wörter nicht erkannt wird!) und ob auf einer Fußball-Seite das Wort "Fußball" oft genug fällt, um es in der entsprechenden Kategorie einzuordnen, halte ich für eine gewagte Theorie.


rage_quit hat bestimmt einen besseren Vorschlag für dich ;-)

Viele Grüße,
MaBa

_________________
Dipl.-Inform. Markus Barth
Fachhochschule Trier
Umwelt-Campus Birkenfeld
daddeldu
Unregistrierter




Beitrag daddeldu Unregistrierter 15:05:57 31.08.2010   Titel:              Zitieren

Danke
Man noch versuchen ausm <title> abzuleiten und ansonsten wird es
rage_qu1t
Unregistrierter




Beitrag rage_qu1t Unregistrierter 18:09:06 31.08.2010   Titel:              Zitieren

MaBa schrieb:
rage_quit hat bestimmt einen besseren Vorschlag für dich ;-)
na klar nimm nen aktuellen browser (firefox) dann kannst auch reine js seiten in deinen index aufnehmen ;)

faken kann man nur das nicht was der user real auf dem bildschirm sieht daher werden seit jahren keywords eigentlich nicht mehr fürs ranking verwendet;)
rage_qu1t
Unregistrierter




Beitrag rage_qu1t Unregistrierter 18:12:31 31.08.2010   Titel:              Zitieren

sowas hast gesucht oder :confused:
C/C++ Forum :: Webzeugs ::  algorythmus gesucht bzw. evtl. ein Tipp   Auf Beitrag antworten

Zeige alle Beiträge auf einer Seite




Nächstes Thema anzeigen
Vorheriges Thema anzeigen
Sie können Beiträge in dieses Forum schreiben.
Sie können auf Beiträge in diesem Forum antworten.
Sie können Ihre Beiträge in diesem Forum nicht bearbeiten.
Sie können Ihre Beiträge in diesem Forum nicht löschen.
Sie können an Umfragen in diesem Forum nicht mitmachen.

Powered by phpBB © 2001, 2002 phpBB Group :: FI Theme

c++.de ist Teilnehmer des Partnerprogramms von Amazon Europe S.à.r.l. und Partner des Werbeprogramms, das zur Bereitstellung eines Mediums für Websites konzipiert wurde, mittels dessen durch die Platzierung von Werbeanzeigen und Links zu amazon.de Werbekostenerstattung verdient werden kann.

Die Vervielfältigung der auf den Seiten www.c-plusplus.de, www.c-plusplus.info, www.c-sar.de, www.c-plusplus.net und www.baeckmann.de enthaltenen Informationen ohne eine schriftliche Genehmigung des Seitenbetreibers ist untersagt (vgl. §4 Urheberrechtsgesetz). Die Nutzung und Änderung der vorgestellten Strukturen und Verfahren in privaten und kommerziellen Softwareanwendungen ist ausdrücklich erlaubt, soweit keine Rechte Dritter verletzt werden. Der Seitenbetreiber übernimmt keine Gewähr für die Funktion einzelner Beiträge oder Programmfragmente, insbesondere übernimmt er keine Haftung für eventuelle aus dem Gebrauch entstehenden Folgeschäden.