DE202004021885U1 - System zur Informationswiedergewinnung basierend auf historischen Daten - Google Patents
System zur Informationswiedergewinnung basierend auf historischen Daten Download PDFInfo
- Publication number
- DE202004021885U1 DE202004021885U1 DE200420021885 DE202004021885U DE202004021885U1 DE 202004021885 U1 DE202004021885 U1 DE 202004021885U1 DE 200420021885 DE200420021885 DE 200420021885 DE 202004021885 U DE202004021885 U DE 202004021885U DE 202004021885 U1 DE202004021885 U1 DE 202004021885U1
- Authority
- DE
- Germany
- Prior art keywords
- document
- link
- score
- date
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
- G06Q30/0246—Traffic
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Computerlesbares Medium, das umfasst: Computerprogrammcode, der, wenn er durch einen oder mehrere Prozessoren ausgeführt wird, den einen oder die mehreren Prozessoren veranlasst: ein Dokument basierend auf einer empfangenen Suchabfrage zu identifizieren; ein Maß der Relevanz des Dokuments für die Suchabfrage zu bestimmen; einen oder mehrere linkgestützte Faktoren, die den Links zu dem Dokument zugeordnet sind, zu identifizieren, Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich eines Dokuments während der Zeit entsprechen, zu identifizieren, eine Punktzahl für das Dokument basierend auf dem Maß der Relevanz des Dokuments für die Suchabfrage, dem einen oder den mehreren linkgestützten Faktoren, die den Links zu dem Dokument zugeordnet sind, und den Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments entsprechen, zu erzeugen; und das Dokument hinsichtlich wenigstens eines weiteren Dokuments basierend auf der Punktzahl einzustufen.
Description
- HINTERGRUND DER ERFINDUNG
- Gebiet der Erfindung
- Die vorliegende Erfindung bezieht sich im Allgemeinen auf Informationswiedergewinnungssysteme und insbesondere auf Systeme, computerlesbare Medien und Server zum Erzeugen von Suchergebnissen, wenigstens teilweise auf historischen Daten basierend, die relevanten Dokumenten zugeordnet sind.
- Beschreibung der verwandten Technik
- Das World Wide Web (”Web”) enthält eine riesige Menge von Informationen. Die Suchmaschinen unterstützen die Benutzer beim Lokalisieren der gewünschten Teile dieser Informationen durch das Katalogisieren der Webdokumente. Typischerweise schickt eine Suchmaschine in Reaktion auf die Abfrage eines Benutzers Links zu Dokumenten zurück, die für die Abfrage relevant sind.
- Die Suchmaschinen können ihre Bestimmung der Interessen des Benutzers auf die Suchbegriffe (die als eine Suchabfrage bezeichnet werden) stützen, die durch den Benutzer bereitgestellt werden. Es ist das Ziel der Suchmaschine, die Links zu relevanten Ergebnissen in hoher Qualität basierend auf der Suchabfrage zu identifizieren. Typischerweise führt die Suchmaschine dies aus, indem sie die Begriffe in der Suchabfrage mit einem Körper im Voraus gespeicherter Webdokumente vergleicht. Die Webdokumente, die die Suchbegriffe des Benutzers enthalten, werden als ”Treffer” betrachtet und zu dem Benutzer zurückgeschickt.
- Im Idealfall versieht eine Suchmaschine in Reaktion auf eine gegebene Suchabfrage des Benutzers den Benutzer mit den relevantesten Ergebnissen. Eine Kategorie der Suchmaschinen identifiziert die relevanten Dokumente basierend auf einem Vergleich der Begriffe der Suchabfrage mit den in den Dokumenten enthaltenen Wörtern. Eine weitere Kategorie der Suchmaschinen identifiziert die relevanten Dokumente unter Verwendung von Faktoren, die von dem Vorhandensein der Begriffe der Suchabfrage in den Dokumenten verschieden sind oder zusätzlich zum Vorhandensein der Begriffe der Suchabfrage in den Dokumenten. Eine Suchmaschine verwendet die Informationen, die den Links zu den oder von den Dokumenten zugeordnet sind, um die relative Wichtigkeit der Dokumente zu bestimmen.
- Beide Kategorien der Suchmaschinen sind bestrebt, für eine Suchabfrage Ergebnisse in hoher Qualität bereitzustellen. Es gibt mehrere Faktoren, die die Qualität der durch eine Suchmaschine erzeugten Ergebnisse beeinflussen können. Irgendwelche Hersteller von Web-Sites verwenden z. B. Spamtechniken, um ihren Rang künstlich hochzutreiben. Außerdem können ”verbrauchte” Dokumente (d. h., jene Dokumente, die während einer Zeitdauer nicht aktualisiert worden sind und folglich verbrauchte Daten enthalten) höher als ”frischere” Dokumente (d. h., jene Dokumente, die kürzlich aktualisiert worden sind und folglich neuere Daten enthalten) eingestuft werden. In einigen speziellen Zusammenhängen verschlechtern verbrauchte Dokumente mit höherer Einstufung die Suchergebnisse.
- Folglich verbleibt ein Bedarf an der Verbesserung der Qualität der durch die Suchmaschinen erzeugten Ergebnisse.
- ZUSAMMENFASSUNG DER ERFINDUNG
- Die Systeme, computerlesbaren Medien und Server, die mit den Prinzipien der Erfindung konsistent sind, können Dokumente wenigstens teilweise basierend auf den den Dokumenten zugeordneten Historiedaten bewerten. Diese Bewertung kann verwendet werden, um die im Zusammenhang mit einer Suchabfrage erzeugten Suchergebnisse zu verbessern.
- Gemäß einem Aspekt, der mit den Prinzipien der Erfindung konsistent ist, wird ein System, computerlesbares Mediun oder ein Server zum Bewerten eines Dokuments geschaffen und kann dabei das Identifizieren eines Dokuments und das Erhalten eines oder mehrerer Typen von Historiedaten, die dem Dokument zugeordnet sind, sowie ferner das Erzeugen einer Punktzahl für das Dokument, wenigstens teilweise basierend auf dem einen oder den mehreren Typen der Historiedaten, enthalten.
- Gemäß einem weiteren Aspekt wird ein System, computerlesbares Mediun oder ein Server zum Bewerten von Dokumenten geschaffen und kann dabei das Bestimmen eines Alters der Verlinkungsdaten, die einem verlinkten Dokument zugeordnet sind, und das Einstufen des verlinkten Dokuments basierend auf einer Zerfallsfunktion des Alters der Verlinkungsdaten enthalten.
- KURZBESCHREIBUNG DER ZEICHNUNGEN
- Die beigefügten Zeichnungen, die in diese Beschreibung aufgenommen sind und einen Teil dieser Beschreibung bilden, veranschaulichen eine Ausführungsform der Erfindung und erklären zusammen mit der Beschreibung die Erfindung. In den Zeichnungen sind
-
1 eine graphische Darstellung eines beispielhaften Netzes, in dem die Systeme, computerlesbaren Medien und Server, die mit den Prinzipien der Erfindung konsistent sind, implementiert sein können; -
2 eine beispielhafte graphische Darstellung eines Clients und/oder eines Servers nach1 gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist; -
3 ein beispielhafter funktionaler Blockschaltplan der Suchmaschine nach1 gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist; und -
4 ein Ablaufplan einer beispielhaften Verarbeitung zum Bewerten von Dokumenten gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist. - AUSFÜHRLICHE BESCHREIBUNG
- Die folgende ausführliche Beschreibung der Erfindung bezieht sich auf die beigefügten Zeichnungen. Die gleichen Bezugszeichen in den verschiedenen Zeichnungen können gleiche oder ähnliche Elemente identifizieren. Außerdem schränkt die folgende ausführliche Beschreibung die Erfindung nicht ein.
- Die Systeme, computerlesbare Medien und Server, die mit den Prinzipien der Erfindung konsistent sind, können Dokumente z. B. unter Verwendung von Historiedaten, die den Dokumenten zugeordnet sind, bewerten. Die Systeme, computerlesbaren Medien und Server können diese Punktzahlen verwenden, um Suchergebnisse in hoher Qualität bereitzustellen.
- Ein ”Dokument”, wie der Begriff hierin verwendet wird, ist umfassend zu interpretieren, um jedes maschinenlesbare und maschinenspeicherbare Arbeitsprodukt einzuschließen. Ein Dokument kann eine E-Mail, eine Web-Site, eine Datei, die Kombination von Dateien, eine oder mehrere Dateien mit eingebetteten Links zu anderen Dateien, einen Beitrag zu einer Nachrichtengruppe, einen Blog, eine Webwerbung usw. enthalten. Im Kontext des Internets ist ein übliches Dokument eine Web-Seite. Web-Seiten enthalten oft Textinformationen und können eingebettete Informationen (wie z. B. Metainformationen, Bilder, Hyperlinks usw.) und/oder eingebetteten Befehle (wie z. B. Javascript usw.) enthalten. Eine Seite kann einem Dokument oder einem Teil eines Dokuments entsprechen. Deshalb können die Wörter ”Seite” und ”Dokument” in einigen Fällen austauschbar verwendet werden. In anderen Fällen kann sich eine Seite auf einen Teil eines Dokuments, wie z. B. ein untergeordnetes Dokument, beziehen. Es kann außerdem möglich sein, dass eine Seite mehr als einem einzigen Dokument entspricht.
- In der folgenden Beschreibung können Dokumente so beschrieben werden, dass sie Links zu anderen Dokumenten und/oder Links von anderen Dokumenten besitzen. Wenn ein Dokument z. B. einen Link zu einem weiteren Dokument enthält, kann der Link als ein ”Vorwärts-Link” bezeichnet werden. Wenn ein Dokument einen Link von einem weiteren Dokument enthält, kann der Link als ein ”Rückwärts”-Link bezeichnet werden. Wenn der Begriff ”Link” verwendet wird, kann er sich entweder auf einen Rückwärts-Link oder auf einen Vorwärts-Link beziehen.
- EINE BEISPIELHAFTE NETZKONFIGURATION
-
1 ist eine beispielhafte graphische Darstellung eines Netzes100 , in dem die Systeme, computerlesbaren Medien und Server, die mit den Prinzipien der Erfindung konsistent sind, implementiert sein können. Das Netz100 kann mehrere Clients110 enthalten, die über ein Netz150 mit mehreren Servern120 –140 verbunden sind. Das Netz150 kann ein lokales Netz (LAN), ein weiträumiges Netz (WAN), ein Telephonnetz, wie z. B. das öffentliche Fernsprechwählnetz (PSTN), ein Intranet, das Internet, eine Speichervorrichtung, einen weiteren Netztyp oder eine Kombination aus Netzen enthalten. Für die Einfachheit sind zwei Clients110 und drei Server120 –140 als mit dem Netz150 verbunden veranschaulicht worden. In der Praxis kann es mehr oder weniger Clients und Server geben. Außerdem kann in einigen Fällen ein Client die Funktionen eines Servers ausführen und kann ein Server die Funktionen eines Clients ausführen. - Die Clients
110 können Client-Entitäten enthalten. Eine Entität kann als eine Vorrichtung definiert sein, wie z. B. ein drahtloses Telephon, ein Personal-Computer, ein persönlicher digitaler Assistent (PDA), ein Laptop oder ein anderer Typ einer Rechen- oder Kommunikationsvorrichtung, ein Thread oder ein Prozess, der auf einer dieser Vorrichtungen abläuft, und/oder ein durch eine dieser Vorrichtungen ausführbares Objekt. Die Server120 –140 können Server-Entitäten enthalten, die Dokumente auf eine Art, die mit den Prinzipien der Erfindung konsistent ist, sammeln, verarbeiten, suchen und/oder aufrechterhalten. Die Clients110 und die Server120 –140 können über verdrahtete, drahtlose und/oder optische Verbindungen mit dem Netz150 verbunden sein. - In einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist, kann der Server
120 eine Suchmaschine125 enthalten, die durch die Clients110 benutzbar ist. Der Server120 kann einen Körper von Dokumenten (z. B. Web-Seiten) crawlen, die Dokumente indexieren und die den Dokumenten zugeordneten Informationen in einem Lager der gecrawlten Dokumente speichern. Die Server130 und140 können die Dokumente, die durch den Server120 gecrawlt werden können, speichern oder aufrechterhalten. Während die Server120 –140 als separate Entitäten gezeigt sind, kann es möglich sein, dass ein oder mehrere Server120 –140 eine oder mehrere der Funktionen eines weiteren oder mehrerer der Server120 –140 ausführen. Es kann z. B. möglich sein, dass zwei oder mehr der Server120 –140 als ein einziger Server implementiert sind. Es kann außerdem möglich sein, dass ein einzelner Server der Server120 –140 als zwei oder mehr separate (und möglicherweise verteilte) Vorrichtungen implementiert ist. - EINE BEISPIELHAFTE CLIENT-/SERVER-ARCHITEKTUR
-
2 ist eine beispielhafte graphische Darstellung einer Client- oder Server-Entität (die im Folgenden als ”Client-/Server-Entität” bezeichnet wird), die einem oder mehreren der Clients110 und Server120 –140 entsprechen kann, gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist. Die Client-/Server-Entität kann einen Bus210 , einen Prozessor220 , einen Hauptspeicher230 , einen Festwertspeicher (ROM)240 , eine Speichervorrichtung250 , eine oder mehrere Eingabevorrichtungen260 , eine oder mehrere Ausgabevorrichtungen270 und eine Kommunikationsschnittstelle280 enthalten. Der Bus210 kann einen oder mehrere Leiter enthalten, die die Kommunikation zwischen den Komponenten der Client-/Server-Entität erlauben. - Der Prozessor
220 kann einen oder mehrere herkömmliche Prozessoren oder Mikroprozessoren enthalten, die die Befehle interpretieren und ausführen. Der Hauptspeicher230 kann einen Schreib-Lese-Speicher (RAM) oder einen weiteren Typ einer dynamischen Speichervorrichtung enthalten, der die Informationen und die Befehle für die Ausführung durch den Prozessor220 speichert. Der ROM240 kann eine herkömmliche ROM-Vorrichtung oder einen weiteren Typ einer statischen Speichervorrichtung enthalten, die bzw. der statische Informationen und Befehle für die Verwendung durch den Prozessor220 speichert. Die Speichervorrichtung250 kann ein magnetisches und/oder optisches Aufzeichnungsmedium und sein entsprechendes Laufwerk enthalten. - Die Eingabevorrichtung(en)
260 kann (können) einen oder mehrere herkömmliche Mechanismen enthalten, die es einer Bedienungsperson erlauben, Informationen in die Client-/Server-Entität einzugeben, wie z. B. eine Tastatur, eine Maus, einen Stift, Spracherkennung und/oder biometrische Mechanismen usw. Die Ausgabevorrichtung(en)270 kann (können) einen oder mehrere herkömmliche Mechanismen enthalten, die Informationen an die Bedienungsperson ausgeben, einschließlich einer Anzeige, eines Druckers, eines Lautsprechers usw. Die Kommunikationsschnittstelle280 kann irgendeinen sender-/empfängerartigen Mechanismus enthalten, der es der Client-/Server-Entität ermöglicht, mit anderen Vorrichtungen und/oder Systemen zu kommunizieren. Die Kommunikationsschnittstelle280 kann z. B. Mechanismen enthalten, um mit einer weiteren Vorrichtung oder einem weiteren System über ein Netz, wie z. B. das Netz150 , zu kommunizieren. - Wie im Folgenden ausführlich beschrieben wird, führt die Client-/Server-Entität, die mit den Prinzipien der Erfindung konsistent ist, bestimmte auf das Suchen bezogene Operationen aus. Die Client-/Server-Entität kann diese Operationen in Reaktion auf den Prozessor
220 ausführen, der Software-Befehle ausführt, die in einem computerlesbaren Medium, wie z. B. dem Speicher230 , enthalten sind. Ein computerlesbares Medium kann als eine oder mehrere physische oder logische Speichervorrichtungen und/oder Trägerwellen definiert sein. - Die Software-Befehle können von einem weiteren computerlesbaren Medium, wie z. B. der Datenspeichervorrichtung
250 , oder von einer weiteren Vorrichtung über die Kommunikationsschnittstelle280 in den Speicher230 gelesen werden. Die im Speicher230 enthaltenen Software-Befehle können den Prozessor220 veranlassen, die Prozesse auszuführen, die später beschrieben werden. Alternativ kann anstelle von oder in Kombination mit den Software-Befehlen eine festverdrahtete Schaltungsanordnung verwendet werden, um die Prozesse zu implementieren, die mit den Prinzipien der Erfindung konsistent sind. Folglich sind die Implementierungen, die mit den Prinzipien der Erfindung konsistent sind, nicht auf irgendeine spezifische Kombination aus einer Hardware-Schaltungsanordnung und Software eingeschränkt. - EINE BEISPIELHAFTE SUCHMASCHINE
-
3 ist ein beispielhafter funktionaler Blockschaltplan der Suchmaschine125 gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist. Die Suchmaschine125 kann einen Dokumentenlokalisierer310 , eine Historiekomponente320 und eine Einstufungskomponente330 enthalten. Wie in3 gezeigt ist, können mit einem Dokumentenkörper340 ein oder mehrere Dokumentenlokalisierer310 und Historiekomponenten320 verbunden sein. Der Dokumentenkörper340 kann Informationen enthalten, die Dokumenten zugeordnet sind, die vorher gecrawlt, indexiert und z. B. in einer Datenbank, die durch die Suchmaschine125 zugänglich ist, gespeichert worden sind. Die Historiedaten können, wie im Folgenden ausführlicher beschrieben wird, jedem der Dokumente im Dokumentenkörper340 zugeordnet sein. Die Historiedaten können im Dokumentenkörper340 oder anderswo gespeichert sein. - Der Dokumentenlokalisierer
310 kann eine Menge von Dokumenten identifizieren, deren Inhalte einer Suchabfrage eines Benutzers entsprechen. Der Dokumentenlokalisierer310 kann anfangs Dokumente aus dem Dokumentenkörper340 lokalisieren, indem er die Begriffe in der Suchabfrage des Benutzers mit den Dokumenten in dem Körper vergleicht. Im Allgemeinen sind die Prozesse zum Indexieren der Dokumente und zum Durchsuchen der indexierten Sammlung, um eine Menge von Dokumenten zurückzuschicken, die die gesuchten Begriffe enthalten, in der Technik wohlbekannt. Demgemäß wird diese Funktionalität des Dokumentenlokalisierers310 hierin nicht weiter beschrieben. - Die Historiekomponente
320 kann Historiedaten, die den Dokumenten im Dokumentenkörper340 zugeordnet sind, sammeln. In Implementierungen, die mit den Prinzipien der Erfindung konsistent sind, können die Historiedaten Daten enthalten, die mit: den Dokumentenanfangsdaten; den Aktualisierungen/Änderungen der Dokumenteninhalte; einer Abfrageanalyse; linkgestützten Kriterien; einem Ankertext (z. B. der Text, in den ein Hyperlink eingebettet ist, der in einem Dokument typischerweise unterstrichen oder anderweitig hervorgehoben ist); Verkehr; einem Benutzerverhalten; domainbezogenen Informationen; einer Einstufungshistorie; vom Benutzer aufrechterhaltenen/erzeugten Daten (z. B. Lesezeichen); eindeutigen Wörtern, Bigrammen und Redewendungen im Ankertext; der Verlinkung unabhängiger Peers; und/oder Dokumententhemen in Beziehung stehen. Diese verschiedenen Typen der Historiedaten werden im Folgenden zusätzlich ausführlich beschrieben. In anderen Implementierungen können die Historiedaten zusätzliche oder andere Arten der Daten enthalten. - Die Einstufungskomponente
330 kann eine Einstufungs-Punktzahl (die hierin außerdem einfach als eine ”Punktzahl” bezeichnet wird) einem oder mehreren Dokumenten im Dokumentenkörper340 zuordnen. Die Einstufungskomponente330 kann die Einstufungs-Punktzahlen vor, unabhängig von oder im Zusammenhang mit einer Suchabfrage zuweisen. Wenn die Dokumente einer Suchabfrage zugeordnet werden (z. B. als für die Suchabfrage relevant identifiziert werden), kann die Suchmaschine125 die Dokumente basierend auf der Einstufungs-Punktzahl sortieren und die sortierte Menge der Dokumente an den Client, der die Suchabfrage abgeschickt hat, zurückschicken. Konsistent mit den Aspekten der Erfindung ist die Einstufungs-Punktzahl ein Wert, der versucht, die Qualität der Dokumente zu quantifizieren. In Implementierungen, die mit den Prinzipien der Erfindung konsistent sind, basiert diese Punktzahl wenigstens teilweise auf den Historiedaten von der Historiekomponente320 . - BEISPIELHAFTE HISTORIEDATEN
- Das Dokumentenanfangsdatum
- Gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist, kann das Anfangsdatum eines Dokuments verwendet werden, um eine diesem Dokument zugeordnete Punktzahl zu erzeugen (oder zu ändern). Der Begriff ”Datum” wird hier umfassend verwendet und kann folglich Zeit- und Datumsmessungen enthalten. Wie im Folgenden beschrieben wird, gibt es mehrere Techniken, die verwendet werden können, um das Anfangsdatum eines Dokuments zu bestimmen. Einige dieser Techniken sind in dem Sinn ”voreingenommen”, dass sie durch dritte Parteien beeinflusst werden können, die es wünschen, die einem Dokument zugeordnete Punktzahl zu verbessern. Andere Techniken sind nicht voreingenommen. Irgendeine dieser Techniken, Kombinationen aus diesen Techniken oder noch weitere Techniken können verwendet werden, um das Anfangsdatum eines Dokuments zu bestimmen.
- Gemäß einer Implementierung kann das Anfangsdatum eines Dokuments aus dem Datum bestimmt werden, an dem die Suchmaschine
125 zuerst das Dokument in Erfahrung bringt oder indexiert. Die Suchmaschine125 kann das Dokument durch Crawlen, Einreichen des Dokuments (oder einer Darstellung/Zusammenfassung davon) zur Suchmaschine125 von einer ”äußeren” Quelle, einer Kombination aus crawl- oder einreichungsbasierten Indexierungstechniken oder auf andere Arten entdecken. Alternativ kann das Anfangsdatum eines Dokuments aus dem Datum bestimmt werden, an dem die Suchmaschine125 zuerst einen Link zu dem Dokument entdeckt. - Gemäß einer weiteren Implementierung kann das Datum, an dem eine Domain, bei der das Dokument registriert ist, worden ist, als ein Hinweis auf das Anfangsdatum des Dokuments verwendet werden. Gemäß einer noch weiteren Implementierung kann der erste Zeitpunkt, zu dem in einem weiteren Dokument, wie z. B. einem Nachrichtenartikel, einer Nachrichtengruppe, einer Mailingliste oder einer Kombination aus einem oder mehreren derartigen Dokumenten, auf ein Dokument Bezug genommen worden ist, verwendet werden, um ein Anfangsdatum des Dokuments abzuleiten. Gemäß einer weiteren Implementierung kann das Datum, an dem ein Dokument wenigstens eine Schwellenzahl von Seiten enthält, als ein Hinweis auf das Anfangsdatum des Dokuments verwendet werden. Gemäß einer weiteren Implementierung kann das Anfangsdatum eines Dokuments gleich einem Zeitstempel sein, der dem Dokument durch den Server, der das Dokument hostet, zugeordnet worden ist. Es könnten andere Techniken, die hierin nicht spezifisch erwähnt sind, oder Kombinationen aus Techniken verwendet werden, um ein Anfangsdatum eines Dokuments zu bestimmen oder abzuleiten.
- Die Suchmaschine
125 kann das Anfangsdatum eines Dokuments verwenden, um das Dokument zu bewerten. Es kann z. B. angenommen werden, dass ein Dokument mit einem ziemlich neuen Anfangsdatum keine signifikante Anzahl von Links von anderen Dokumenten (d. h. Rückwärts-Links) besitzt. Für vorhandene linkbasierte Bewertungstechniken, die basierend auf der Anzahl der Links zu/von einem Dokument bewerten, kann dieses neue Dokument niedriger als ein älteres Dokument bewertet werden, das eine größere Anzahl von Links (z. B. Rückwärts-Links) besitzt. Wenn das Anfangsdatum der Dokumente berücksichtigt wird, können jedoch die Punktzahlen der Dokumente basierend auf den Anfangsdaten der Dokumente (entweder positiv oder negativ) modifiziert werden. - Es wird das Beispiel eines Dokuments mit einem Anfangsdatum von gestern betrachtet, auf das durch 10 Rückwärts-Links Bezug genommen wird. Dieses Dokument kann durch die Suchmaschine
125 höher als ein Dokument mit einem Anfangsdatum von 10 Jahren vorher, auf das durch 100 Rückwärts-Links Bezug genommen wird, bewertet werden, weil die Rate des Link-Wachstums für das Erstere relativ höher als für das Letztere ist. Während eine spitze Wachstumsrate der Anzahl der Rückwärts-Links ein Faktor sein kann, der durch die Suchmaschine125 verwendet wird, um die Dokumente zu bewerten, kann sie außerdem einen Versuch signalisieren, die Suchmaschine125 zu spammen. Demgemäß kann in dieser Situation die Suchmaschine125 tatsächlich die Punktzahl eines Dokuments (von Dokumenten) verringern, um die Wirkung des Spammens zu verringern. - Folglich kann gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist, die Suchmaschine
125 das Anfangsdatum eines Dokuments verwenden, um eine Rate zu bestimmen, mit der die Links zu dem Dokument erzeugt werden (z. B. als ein Durchschnitt pro Einheitszeit basierend auf der Anzahl der Links, die seit dem Anfangsdatum oder irgendeinem Fenster in dieser Periode erzeugt worden sind). Diese Rate kann dann verwendet werden, um das Dokument zu bewerten, indem z. B. Dokumenten mehr Gewicht gegeben wird, zu denen die Links häufiger erzeugt werden. - In einer Implementierung kann die Suchmaschine
125 die linkgestützte Punktzahl eines Dokuments wie folgt modifizieren:H = L/log(F + 2), US-Patent Nr. 6.285.999 beschriebenen Bewertungstechnik), die basierend auf den Links zu/von dem Dokument einem Dokument eine Punktzahl zuweist, und sich F auf eine verstrichene Zeit beziehen kann, die von dem dem Dokument zugeordneten Anfangsdatum (oder einem Fenster innerhalb dieser Periode) gemessen worden ist. - Für einige Abfragen können ältere Dokumente vorteilhafter als neuere Dokumente sein. Im Ergebnis kann es vorteilhaft sein, die Punktzahl eines Dokuments basierend auf dem Unterschied (im Alter) vom Durchschnittsalter der Ergebnismenge einzustellen. Mit anderen Worten, die Suchmaschine
125 kann das Alter jedes der Dokumente in einer Ergebnismenge bestimmen (z. B. unter Verwendung ihrer Anfangsdaten), das Durchschnittsalter der Dokumente bestimmen und die Punktzahlen der Dokumente (entweder positiv oder negativ) basierend auf einem Unterschied zwischen dem Alter des Dokuments und dem Durchschnittsalter modifizieren. - Zusammenfassend kann die Suchmaschine
125 eine einem Dokument zugeordnete Punktzahl wenigstens teilweise auf den Informationen bezüglich des Anfangsdatums des Dokuments basierend erzeugen (oder ändern). - Aktualisierungen/Änderungen der Inhalte
- Gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist, können Informationen bezüglich einer Art, auf die sich die Inhalte eines Dokuments im Lauf der Zeit ändern, verwendet werden, um eine diesem Dokument zugeordnete Punktzahl zu erzeugen (oder zu ändern). Ein Dokument, dessen Inhalte oft bearbeitet werden, kann z. B. anders als ein Dokument bewertet werden, dessen Inhalte im Lauf der Zeit statisch bleiben. Außerdem kann ein Dokument, bei dem eine relativ große Menge seiner Inhalte im Lauf der Zeit aktualisiert worden ist, anders als ein Dokument bewertet werden, bei dem eine relativ kleine Menge seiner Inhalte im Lauf der Zeit aktualisiert worden ist.
- In einer Implementierung kann die Suchmaschine
125 eine Inhaltsaktualisierungs-Punktzahl (U) wie folgt erzeugen:U = f(UF, UA), - UA kann außerdem als eine Funktion von einem oder mehreren Faktoren bestimmt werden, wie z. B. der Anzahl der ”neuen” oder eindeutigen Seiten, die während einer Zeitdauer einem Dokument zugeordnet worden sind. Ein weiterer Faktor könnte das Verhältnis der Anzahl der neuen oder eindeutigen Seiten, die während einer Zeitdauer einem Dokument zugeordnet worden sind, zu der Gesamtzahl der dem Dokument zugeordneten Seiten enthalten. Ein noch weiterer Faktor kann die Menge enthalten, um die das Dokument während einer oder mehrerer Zeitdauern aktualisiert worden ist (z. B. n% der sichtbaren Inhalte eines Dokuments können sich während einer Periode t (z. B. der letzten m Monate) ändern), die ein Durchschnittswert sein könnte. Ein weiterer Faktor könnte die Menge enthalten, um die sich das Dokument (oder die Seite) in einer oder mehreren Zeitdauern (z. B. innerhalb der letzten x Tage) geändert hat.
- Gemäß einer beispielhaften Implementierung kann UA als eine Funktion verschieden gewichteter Teile der Dokumenteninhalte bestimmt sein. Den Inhalten, die als unwichtig erachtet werden, falls sie aktualisiert/geändert werden, wie z. B. Javascript, Kommentare, Werbung, Navigationselemente, Standardformulierungsmaterial oder Datums-/Zeitetiketten, kann ein relativ geringes Gewicht gegeben werden oder sie können sogar insgesamt ignoriert werden, wenn UA bestimmt wird. Andererseits könnte Inhalten, die als wichtig erachtet werden, falls sie aktualisiert/geändert werden (z. B. häufiger, neuer, umfangreicher usw.), wie z. B. dem Titel oder einem Ankertext, der den Vorwärts-Links zugeordnet ist, mehr Gewicht als den Änderungen an anderen Inhalten gegeben werden, wenn UA bestimmt wird.
- UF und UA können auf andere Arten verwendet werden, um die einem Dokument zugeordnete Punktzahl zu beeinflussen. Die Änderungsrate in einer aktuellen Zeitdauer kann z. B. mit der Änderungsrate in einer weiteren (z. B. früheren) Zeitdauer verglichen werden, um zu bestimmen, ob es einen Beschleunigungs- oder Verzögerungstrend gibt. Die Dokumente, für die es eine Zunahme der Änderungsrate gibt, könnten höher als jene Dokumente bewertet werden, für die es einen stationären Zustand der Änderung gibt, selbst wenn diese Änderungsrate relativ hoch ist. Die Menge der Änderung kann außerdem ein Faktor bei dieser Bewertung sein. Die Dokumente, für die es eine Zunahme der Änderungsrate gibt, wenn die Menge der Änderung größer als irgendein Schwellenwert ist, könnten z. B. höher als jene Dokumente bewertet werden, für die es einen stationären Zustand der Änderungsrate gibt oder eine Menge der Änderung kleiner als der Schwellenwert ist.
- In einigen Situationen können die Datenspeicherbetriebsmittel unzureichend sein, um die Dokumente zu speichern, wenn die Dokumente auf Inhaltsänderungen überwacht werden. In diesem Fall kann die Suchmaschine
125 Darstellungen der Dokumente speichern und diese Darstellungen auf Änderungen überwachen. Die Suchmaschine125 kann z. B. anstelle der (ganzen) Dokumente selbst ”Signaturen” der Dokumente speichern, um die Änderungen an den Dokumenteninhalten zu detektieren. In diesem Fall kann die Suchmaschine125 einen Begriffsvektor für ein Dokument (oder eine Seite) speichern und ihn auf relativ große Änderungen überwachen. Gemäß einer weiteren Implementierung kann die Suchmaschine125 einen relativ kleinen Teil (z. B. einige Begriffe) der Dokumente, die als wichtig oder als die am häufigsten auftretenden (ausschließlich der ”Stopwörter”) bestimmt werden, speichern und überwachen. - Gemäß einer noch weiteren Implementierung kann die Suchmaschine
125 eine Zusammenfassung oder eine andere Darstellung eines Dokuments speichern und diese Informationen auf Änderungen überwachen. Gemäß einer weiteren Implementierung kann die Suchmaschine125 einen Ähnlichkeits-Hash (der verwendet werden kann, um eine Beinaheverdopplung eines Dokuments zu detektieren) für das Dokument erzeugen und ihn auf Änderungen überwachen. Eine Änderung in einem Ähnlichkeits-Hash kann so betrachtet werden, dass sie eine relativ große Änderung in seinem zugeordneten Dokument angibt. In anderen Implementierungen können noch andere Techniken verwendet werden, um Dokumente auf Änderungen zu überwachen. In Situationen, in denen angemessene Datenspeicherbetriebsmittel vorhanden sind, können anstatt irgendeiner Darstellung der Dokumente vollständige Dokumente gespeichert und verwendet werden, um Änderungen zu bestimmen. - Für einige Abfragen können Dokumente mit Inhalten, die in letzter Zeit nicht geändert worden sind, vorteilhafter als Dokumente mit Inhalten, die in letzter Zeit geändert worden sind, sein. Im Ergebnis kann es vorteilhaft sein, die Punktzahl eines Dokuments basierend auf dem Unterschied vom durchschnittlichen Änderungsdatum der Ergebnismenge einzustellen. Mit anderen Worten, die Suchmaschine
125 kann ein Datum bestimmen, an dem die Inhalte jedes der Dokumente in einer Ergebnismenge zuletzt geändert worden sind, das durchschnittliche Änderungsdatum für die Dokumente bestimmen und die Punktzahlen der Dokumente basierend auf einem Unterschied zwischen dem Änderungsdatum der Dokumente und dem durchschnittlichen Änderungsdatum (entweder positiv oder negativ) ändern. - Zusammenfassend kann die Suchmaschine
125 eine einem Dokument zugeordnete Punktzahl wenigstens teilweise auf Informationen bezüglich einer Art, auf die sich die Inhalte des Dokuments im Lauf der Zeit ändern, basierend erzeugen (oder ändern). Für sehr große Dokumente, die Inhalte enthalten, die zu mehreren Personen oder Organisationen gehören, kann die Punktzahl jedem der untergeordneten Dokumente (d. h. der Inhalte, die zu einer einzelnen Person oder Organisation gehören oder durch eine einzelne Person oder Organisation aktualisiert werden) entsprechen. - Die Abfrageanalyse
- Gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist, können ein oder mehrere abfragebasierte Faktoren verwendet werden, um eine einem Dokument zugeordnete Punktzahl zu erzeugen (oder zu ändern). Ein abfragebasierter Faktor kann sich z. B. auf das Ausmaß beziehen, in dem ein Dokument im Lauf der Zeit ausgewählt wird, wenn das Dokument in einer Menge von Suchergebnissen enthalten ist. In diesem Fall könnte die Suchmaschine
125 die relativ häufiger/zunehmender durch die Benutzer ausgewählten Dokumente höher als andere Dokumente bewerten. - Ein weiterer abfragebasierter Faktor kann sich auf das Auftreten bestimmter Suchbegriffe beziehen, die im Lauf der Zeit in Abfragen erscheinen. Eine spezielle Menge von Suchbegriffen kann während einer Zeitdauer zunehmend in den Abfragen erscheinen. Die Begriffe bezüglich eines ”heißen” Themas, das Popularität gewinnt/gewonnen hat, oder eines Eilmeldungs-Ereignisses würden möglicherweise während einer Zeitdauer häufig erscheinen. In diesem Fall kann die Suchmaschine
125 die Dokumente, die diesen Suchbegriffen (oder Abfragen) zugeordnet sind, höher als die Dokumente bewerten, die diesen Begriffen nicht zugeordnet sind. - Ein weiterer abfragebasierter Faktor kann sich auf eine Änderung im Lauf der Zeit in der Anzahl der durch ähnliche Abfragen erzeugten Suchergebnisse beziehen. Eine signifikante Zunahme der Anzahl der durch ähnliche Abfragen erzeugten Suchergebnisse könnte z. B. ein heißes Thema oder eine Eilmeldung angeben und die Suchmaschine
125 veranlassen, die Punktzahlen der mit derartigen Abfragen in Beziehung stehenden Dokumente zu vergrößern. - Ein weiterer abfragebasierter Faktor kann sich auf Abfragen beziehen, die im Lauf der Zeit relativ konstant bleiben, aber zu Ergebnissen führen, die sich im Lauf der Zeit ändern. Eine Abfrage, die sich auf den ”World Series Champion” bezieht, führt zu Suchergebnissen, die sich im Lauf der Zeit ändern (z. B. Dokumente, die sich auf eine spezielle Mannschaft beziehen, beherrschen die Suchergebnisse in einem gegebenen Jahr oder einer gegebenen Jahreszeit). Diese Änderung kann überwacht und verwendet werden, um die Dokumente entsprechend zu bewerten.
- Ein noch weiterer abfragebasierter Faktor könnte sich auf die ”Verbrauchtheit” der als die Suchergebnisse zurückgeschickten Dokumente beziehen. Die Verbrauchtheit eines Dokuments kann auf Faktoren, wie z. B. dem Erzeugungsdatum des Dokuments, dem Ankerwachstum, dem Verkehr, der Inhaltsänderung, dem Wachstum der Vorwärts-/Rückwärts-Links usw. basieren. Für einige Abfragen können neue Dokumente sehr wichtig sein (falls z. B. nach Dateien mit häufig gestellten Fragen (FAQ) gesucht wird, würde die neueste Version in hohem Grade erwünscht sein). Die Suchmaschine
125 kann lernen, für welche Abfragen die neuen Änderungen am wichtigsten sind, indem sie analysiert, welche Dokumente in den Suchergebnissen durch die Benutzer ausgewählt werden. Spezifischer kann die Suchmaschine125 betrachten, wie oft die Benutzer ein neueres Dokument vorziehen, das in den Suchergebnissen tiefer als ein älteres Dokument eingestuft ist. Wenn außerdem im Lauf der Zeit ein spezielles Dokument in den hauptsächlich aktuellen Abfragen (z. B. ”World Series Champion”) gegenüber spezifischeren Abfragen (z. B. ”New York Yankees”) enthalten ist, dann kann dieser abfragebasierte Faktor – für sich allein oder mit anderen hierin erwähnten – verwendet werden, um eine Punktzahl für ein Dokument zu verringern, das als verbraucht erscheint. - In einigen Situationen kann ein verbrauchtes Dokument als vorteilhafter als neuere Dokumente betrachtet werden. Im Ergebnis kann die Suchmaschine
125 das Ausmaß betrachten, in dem ein Dokument im Lauf der Zeit ausgewählt wird, wenn sie eine Punktzahl für das Dokument erzeugt. Falls z. B. für eine gegebene Abfrage die Benutzer im Lauf der Zeit dazu tendieren, ein niedriger eingestuftes, relativ verbrauchtes Dokument gegenüber einem höher eingestuften, relativ neuem Dokument auszuwählen, kann dies durch die Suchmaschine125 als ein Hinweis verwendet werden, eine Punktzahl des verbrauchten Dokuments einzustellen. - Ein noch weiterer abfragebasierter Faktor kann sich auf das Ausmaß beziehen, in dem ein Dokument in den Ergebnissen für verschiedene Abfragen erscheint. Mit anderen Worten, die Entropie der Abfragen für ein oder mehrere Dokumente kann überwacht und als eine Basis für die Bewertung verwendet werden. Falls z. B. ein spezielles Dokument als ein Treffer für eine widersprechende Menge von Abfragen erscheint, kann dies (obwohl nicht notwendigerweise) als ein Signal betrachtet werden, dass das Dokument Spam ist, wobei in diesem Fall die Suchmaschine
125 das Dokument relativ niedriger bewerten kann. - Zusammenfassend kann die Suchmaschine
125 eine einem Dokument zugeordnete Punktzahl wenigstens teilweise auf einem oder mehreren abfragebasierten Faktoren basierend erzeugen (oder ändern). - Linkbasierte Kriterien
- Gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist, können ein oder mehrere linkbasierte Faktoren verwendet werden, um eine einem Dokument zugeordnete Punktzahl zu erzeugen (oder zu ändern). In einer Implementierung können sich die linkbasierten Faktoren auf die Daten beziehen, an denen neue Links zu einem Dokument erscheinen und an denen vorhandene Links verschwinden. Das Erscheinungsdatum eines Links kann das erste Datum, an dem die Suchmaschine
125 den Link findet, oder das Datum des Dokuments, das den Link enthält, (z. B. das Datum, an dem das Dokument mit dem Link gefunden worden ist, oder das Datum, an dem es zuletzt aktualisiert worden ist), sein. Das Datum des Verschwindens eines Links kann das erste Datum sein, an dem das Dokument, das den Link enthält, entweder den Link fallengelassen hat oder selbst verschwunden ist. - Diese Daten können während der Crawling- oder Indexaktualisierungsoperation durch die Suchmaschine
125 bestimmt werden. Unter Verwendung dieses Datums als Bezug kann die Suchmaschine125 dann das zeitlich veränderliche Verhalten der Links zu dem Dokument, z. B. wann Links erscheinen oder verschwinden, die Rate, mit der die Links im Lauf der Zeit erscheinen oder verschwinden, wie viele Links während einer gegebenen Zeitdauer erscheinen oder verschwinden, ob es einen Trend zum Erscheinen neuer Links gegen das Verschwinden vorhandener Links zu dem Dokument gibt usw., überwachen. - Unter Verwendung des zeitlich veränderlichen Verhaltens der Links zu (und/oder von) einem Dokument kann die Suchmaschine
125 das Dokument entsprechend bewerten. Ein Abwärtstrend in der Anzahl oder der Rate neuer Links (z. B. basierend auf einem Vergleich der Anzahl oder der Rate neuer Links in einer jüngeren Zeitdauer mit jenen in einer älteren Zeitdauer) im Lauf der Zeit könnte der Suchmaschine125 z. B. signalisieren, dass ein Dokument verbraucht ist, wobei in diesem Fall die Suchmaschine125 die Punktzahl des Dokuments verringern kann. Umgekehrt kann ein Aufwärtstrend ein ”frisches” Dokument signalisieren (z. B. ein Dokument, dessen Inhalte frisch sind – kürzlich erzeugt oder aktualisiert worden sind), das in Abhängigkeit von der speziellen Situation und der speziellen Implementierung als relevanter betrachtet werden könnte. - Durch das Analysieren der Änderung der Anzahl oder der Rate der Zunahme/Abnahme von Rückwärts-Links zu einem Dokument (oder einer Seite) im Lauf der Zeit kann die Suchmaschine
125 ein wertvolles Signal ableiten, wie frisch das Dokument ist. Falls z. B. eine derartige Analyse durch eine Kurve widergespiegelt wird, die abfällt, kann dies signalisieren, dass das Dokument verbraucht sein kann (z. B. nicht länger aktualisiert wird, seine Wichtigkeit verringert worden ist, durch ein anderes Dokument ersetzt worden ist usw.). - Gemäß einer Implementierung kann die Analyse von der Anzahl der neuen Links zu einem Dokument abhängen. Die Suchmaschine
125 kann z. B. die Anzahl neuer Links zu einem Dokument in den letzten n Tagen im Vergleich zu der Anzahl neuer Links, seit das Dokument zuerst gefunden worden ist, überwachen. Alternativ kann die Suchmaschine125 das höchste Alter der neuesten y% der Links im Vergleich zum Alter des ersten gefundenen Links bestimmen. - Zum Zweck der Veranschaulichung werden y = 10 und zwei Dokumente (Web-Sites in diesem Beispiel), die beide vor 100 Tagen zuerst gefunden worden sind, betrachtet. Für die erste Site wurden 10% der Links vor weniger als 10 Tagen gefunden, während für die zweite Site 0% der Links vor weniger als 10 Tagen gefunden wurden (mit anderen Worten, sie wurden alle früher gefunden). In diesem Fall führt die Metrik zu 0,1 für die Site A und zu 0 für die Site B. Die Metrik kann geeignet skaliert werden. In einer weiteren beispielhaften Implementierung kann die Metrik modifiziert werden, in dem eine relativ ausführlichere Analyse der Verteilung der Link-Daten ausgeführt wird. Es können z. B. Modelle erstellt werden, die vorhersagen, ob eine spezielle Verteilung einen speziellen Typ der Site (z. B. eine Site, die nicht länger aktualisiert wird, deren Popularität zunimmt oder abnimmt, die ersetzt worden ist usw.) bedeutet.
- Gemäß einer weiteren Implementierung kann die Analyse von den Gewichten abhängen, die den Links zugewiesen sind. In diesem Fall kann jeder Link durch eine Funktion gewichtet sein, die mit der Frische des Links zunimmt. Die Frische eines Links kann durch das Datum des Erscheinens/der Änderung des Links, das Datum des Erscheinens/der Änderung eines Ankertextes, der dem Link zugeordnet ist und/oder das Datum des Erscheinens/der Änderung des Dokuments, das den Link enthält, bestimmt sein. Das Datum des Erscheinens/der Änderung des Dokuments, das einen Link enthält, kann ein besserer Indikator der Frische des Links basierend auf der Theorie sein, dass ein guter Link unverändert bleibt, wenn ein Dokument aktualisiert wird, falls er immer noch relevant und gut ist. Um die Frische jedes Links nicht nach einer geringfügigen Bearbeitung eines winzigen beziehungslosen Teils eines Dokuments zu aktualisieren, kann jedes aktualisierte Dokument auf signifikante Änderungen (z. B. Änderungen an einem großen Teil des Dokuments oder Änderungen an vielen verschiedenen Teilen des Dokuments) getestet werden, wobei die Frische eines Links entsprechend aktualisiert (oder nicht aktualisiert) werden kann.
- Die Links können auf andere Arten gewichtet werden. Die Links können z. B. basierend darauf gewichtet werden, wie sehr den Dokumenten, die die Links enthalten, vertraut wird (z. B. kann Regierungsdokumenten ein hohes Vertrauen gegeben sein). Die Links können außerdem oder alternativ basierend darauf gewichtet werden, wie autoritativ die Dokumente sind, die die Links enthalten (z. B. können autoritative Dokumente auf eine Art bestimmt werden, die zu der ähnlich ist, die im
US-Patent Nr. 6.285.999 beschrieben ist). Die Links können außerdem oder alternativ basierend auf der Frische der Dokumente, die die Links enthalten, unter Verwendung einiger anderer Merkmale, um die Frische festzustellen, gewichtet werden (z. B. ein Dokument, das häufig aktualisiert wird (z. B. die Yahoo-Homepage) lässt plötzlich einen Link zu einem Dokument fallen). - Die Suchmaschine
125 kann die Punktzahl eines Dokuments, zu dem es Links gibt, als eine Funktion der Summe der Gewichte der Links, die auf es zeigen, erhöhen oder verringern. Diese Technik kann rekursiv verwendet werden. Es wird z. B. angenommen, dass ein Dokument S 2 Jahre alt ist. Das Dokument S kann als frisch betrachtet werden, falls n% der Links auf S frisch sind oder falls die Dokumente, die Vorwärts-Links zu S enthalten, als frisch betrachtet werden. Das Letztere kann überprüft werden, indem das Erzeugungsdatum des Dokuments verwendet wird und diese Technik rekursiv angewendet wird. - Gemäß einer noch weiteren Technik kann die Analyse von einer Altersverteilung abhängen, die den auf ein Dokument zeigenden Links zugeordnet ist. Mit anderen Worten, die Daten, an denen die Links zu einem Dokument erzeugt worden sind, können bestimmt werden und in eine Funktion eingegeben werden, die die Altersverteilung bestimmt. Es kann angenommen werden, dass die Altersverteilung eines verbrauchten Dokuments von der Altersverteilung eines frischen Dokuments sehr verschieden ist. Die Suchmaschine
125 kann die Dokumente wenigstens teilweise basierend auf den Altersverteilungen bewerten, die den Dokumenten zugeordnet sind. - Die Daten, an denen die Links erscheinen, können außerdem verwendet werden, um ”Spam” zu detektieren, wenn die Eigentümer der Dokumente oder deren Kollegen für den Zweck, die durch eine Suchmaschine zugewiesene Punktzahl zu erhöhen, Links auf ihr eigenes Dokument erzeugen. Ein typisches ”rechtmäßiges” Dokument zieht Rückwärts-Links langsam an. Eine große Spitze in der Menge der Rückwärts-Links kann ein aktuelles Phänomen signalisieren (die CDC-Web-Site kann z. B. nach einem Ausbruch, wie z. B. von SARS, schnell viele Links entwickeln), oder Versuche signalisieren, eine Suchmaschine durch das Austauschen von Links, das Kaufen von Links oder das Gewinnen von Links von Dokumenten ohne redaktionelle Umsicht beim Herstellen der Links zu spammen (um eine höhere Einstufung und folglich eine bessere Anordnung in den Suchergebnissen zu erhalten). Beispiele von Dokumenten, die Links ohne redaktionelle Umsicht verursachen, enthalten Gästebücher, Referrer-Protolkolle und ”für alle freie” Seiten, die jedem einen Link zu einem Dokument hinzufügen lassen.
- Gemäß einer weiteren Implementierung kann die Analyse von dem Datum abhängen, an dem die Links verschwinden. Das Verschwinden vieler Links kann bedeuten, dass das Dokument, auf das diese Links zeigen, verbraucht ist (z. B. nicht länger aktualisiert wird oder durch ein anderes Dokument ersetzt worden ist). Die Suchmaschine
125 kann z. B. das Datum, an dem ein oder mehrere Links zu einem Dokument verschwinden, die Anzahl der Links, die in einem gegebenen Zeitfenster verschwinden, oder irgendeine andere zeitlich veränderliche Abnahme der Anzahl der Links (oder der Links/Aktualisierungen zu/an den Dokumenten, die derartige Links enthalten) zu einem Dokument überwachen, um die Dokumente zu identifizieren, die als verbraucht betrachtet werden können. Sobald ein Dokument als verbraucht bestimmt worden ist, können die in diesem Dokument enthaltenen Links durch die Suchmaschine125 im Wert vermindert oder ignoriert werden, wenn sie die Punktzahlen für die Dokumente bestimmt, auf die durch die Links gezeigt wird. - Gemäß einer weiteren Implementierung kann die Analyse nicht nur von dem Alter der Links zu einem Dokument abhängen, sondern außerdem von der Dynamik der Links. Als solche kann die Suchmaschine
125 die Dokumente, die jeden Tag einen anders gestalteten Link besitzen, ungeachtet dessen, dass sie einen sehr frischen Link besitzen, anders (z. B. niedriger) als Dokumente gewichten, die konsistent aktualisiert werden und konsistent zu einem gegebenen Zieldokument verlinken. In einer beispielhaften Implementierung kann die Suchmaschine125 eine Punktzahl für ein Dokument basierend auf den Punktzahlen der Dokumente mit Links zu dem Dokument für alle Versionen der Dokumente innerhalb eines Zeitfensters erzeugen. Eine weitere Version dessen kann einen Abschlag/Zerfall basierend auf den Hauptaktualisierungszeiten des Dokuments in die Integration mit einbeziehen. - Zusammenfassend kann die Suchmaschine
125 eine einem Dokument zugeordnete Punktzahl wenigstens teilweise auf einem oder mehreren linkbasierten Faktoren basierend erzeugen (oder ändern). - Der Ankertext
- Gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist, können Informationen bezüglich einer Art, auf die sich der Ankertext im Lauf der Zeit ändert, verwendet werden, um eine einem Dokument zugeordnete Punktzahl zu erzeugen (oder zu ändern). Die Änderungen im Lauf der Zeit im Ankertext, der den Links zu einem Dokument zugeordnet ist, können z. B. als ein Hinweis verwendet werden, dass es eine Aktualisierung oder sogar eine Änderung des Schwerpunkts in dem Dokument gegeben hat.
- Wenn sich die Inhalte eines Dokumentes so ändern, dass sie sich signifikant vom Ankertext unterscheiden, der seinen Rückwärts-Links zugeordnet ist, dann kann sich alternativ die dem Dokument zugeordnete Domain signifikant (vollständig) von einer vorhergehenden Verkörperung geändert haben. Dies kann auftreten, wenn eine Domain erlischt und eine andere Partei die Domain kauft. Weil der Ankertext oft als ein Teil des Dokuments betrachtet wird, auf das sein zugeordneter Link zeigt, kann die Domain in den Suchergebnissen für Abfragen erscheinen, die nicht länger themenbezogen sind. Dies ist ein unerwünschtes Ergebnis.
- Eine Art, dieses Problem anzugehen, besteht darin, das Datum zu schätzen, an dem eine Domain ihren Schwerpunkt geändert hat. Dies kann ausgeführt werden, indem ein Datum bestimmt wird, an dem sich der Text eines Dokuments signifikant ändert oder an dem sich der Text des Ankertextes signifikant ändert. Alle Links und/oder der Ankertext vor diesem Datum können dann ignoriert oder im Wert vermindert werden.
- Die Frische des Ankertextes kann außerdem als ein Faktor beim Bewerten der Dokumente verwendet werden. Die Frische eines Ankertextes kann z. B. durch das Datum des Erscheinens/der Änderung des Ankertextes, das Datum des Erscheinens/der Änderung des Links, der dem Ankertext zugeordnet ist, und/oder das Datum des Erscheinens/der Änderung des Dokuments, auf das der zugeordnete Link zeigt, bestimmt werden. Das Datum des Erscheinens/der Änderung des Dokuments, auf das durch den Link gezeigt wird, kann ein guter Indikator der Frische des Ankertextes basierend auf der Theorie sein, dass ein guter Ankertext unverändert bleibt, wenn das Dokument aktualisiert wird, falls er immer noch relevant und gut ist. Um die Frische eines Ankertextes nicht nach einer geringfügigen Bearbeitung eines winzigen beziehungslosen Teils eines Dokuments zu aktualisieren, kann jedes aktualisierte Dokument auf signifikante Änderungen (z. B. Änderungen an einem großen Teil des Dokuments oder Änderungen an vielen verschiedenen Teilen des Dokuments) getestet werden, wobei die Frische eines Ankertextes entsprechend aktualisiert (oder nicht aktualisiert) werden kann.
- Zusammenfassend kann die Suchmaschine
125 eine einem Dokument zugeordnete Punktzahl wenigstens teilweise auf den Informationen bezüglich einer Art, auf die sich der Ankertext im Lauf der Zeit ändert, basierend erzeugen (oder ändern). - Der Verkehr
- Gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist, können Informationen bezüglich des Verkehrs, der einem Dokument im Lauf der Zeit zugeordnet ist, verwendet werden, um eine dem Dokument zugeordnete Punktzahl zu erzeugen (oder zu ändern). Die Suchmaschine
125 kann z. B. die zeitlich veränderlichen Eigenschaften des Verkehrs zu einem Dokument oder einer anderen ”Verwendung” eines Dokuments durch einen oder mehrere Benutzer überwachen. Eine große Verringerung des Verkehrs kann angeben, dass ein Dokument verbraucht sein kann (z. B. nicht länger aktualisiert wird oder durch ein anderes Dokument ersetzt sein kann). - In einer Implementierung kann die Suchmaschine
125 den Durchschnittsverkehr für ein Dokument während der letzten j Tage (wobei z. B. j = 30 gilt) mit dem Durchschnittsverkehr während des Monats, in dem das Dokument den meisten Verkehr empfangen hat, optional für saisonale Änderungen eingestellt, oder während der letzten k Tage (wobei z. B. k = 365 gilt) vergleichen. Optional kann die Suchmaschine125 sich wiederholende Verkehrsmuster oder vielleicht eine Änderung der Verkehrsmuster im Lauf der Zeit identifizieren. Es kann entdeckt werden, dass es Perioden gibt, in denen ein Dokument mehr oder weniger populär ist (d. h. mehr oder weniger Verkehr besitzt), wie z. B. während der Sommermonate oder an den Wochenenden oder während irgendeiner anderen saisonabhängigen Zeitdauer. Durch das Identifizieren sich wiederholender Verkehrsmuster oder Änderungen der Verkehrsmuster kann die Suchmaschine125 ihre Bewertung des Dokuments während und außerhalb dieser Perioden geeignet einstellen. - Außerdem oder alternativ kann die Suchmaschine
125 zeitlich veränderliche Eigenschaften bezüglich des ”Werbungsverkehrs” für ein spezielles Dokument überwachen. Die Suchmaschine125 kann z. B. einen der oder eine Kombination aus den folgenden Faktoren überwachen: (1) das Ausmaß und die Rate, zu dem bzw. mit der Werbungen durch ein gegebenes Dokument im Lauf der Zeit dargestellt oder aktualisiert werden; (2) die Qualität der Werbetreibenden (z. B. einem Dokument, dessen Werbetreibende sich auf Dokumente beziehen/auf Dokumente verlinken, für die der Suchmaschine125 im Lauf der Zeit bekannt ist, dass sie relativ hohen Verkehr und relativ hohes Vertrauen besitzen, wie z. B. amazon.com, kann relativ mehr Gewicht als jenen Dokumenten gegeben werden, deren Werbetreibende sich auf Dokumente mit niedrigem Verkehr/nicht vertrauenswürdige Dokumente beziehen, wie z. B. eine pornographische Site); und (3) das Ausmaß, zu dem die Werbetreibenden Benutzerverkehr für die Dokumente erzeugen, auf die sie sich beziehen (z. B. ihre Click-Through-Rate (Durchclickrate)). Die Suchmaschine125 kann diese zeitlich veränderlichen Eigenschaften bezüglich des Werbungsverkehrs verwenden, um das Dokument zu bewerten. - Zusammenfassend kann die Suchmaschine
125 eine einem Dokument zugeordnete Punktzahl wenigstens teilweise auf den Informationen bezüglich des Verkehrs, der im Lauf der Zeit dem Dokument zugeordnet ist, basierend erzeugen (oder ändern). - Das Benutzerverhalten
- Gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist, können Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich eines Dokuments im Lauf der Zeit entsprechen, verwendet werden, um eine dem Dokument zugeordnete Punktzahl zu erzeugen (oder zu ändern). Die Suchmaschine
125 kann z. B. die Anzahl, in der ein Dokument aus einer Menge von Suchergebnissen ausgewählt wird, und/oder die Zeitdauer, die ein oder mehrere Benutzer für das Zugreifen auf das Dokument verwenden, überwachen. Die Suchmaschine125 kann dann wenigstens teilweise basierend auf diesen Informationen das Dokument bewerten. - Wenn ein Dokument für eine bestimmte Abfrage zurückgeschickt wird und die Benutzer im Lauf der Zeit oder innerhalb eines gegebenen Zeitfensters angesichts derselben oder einer ähnlichen Abfrage entweder mehr oder weniger Zeit im Durchschnitt für das Dokument verwenden, dann kann dies als ein Hinweis verwendet werden, dass das Dokument frisch bzw. verbraucht ist. Es wird z. B. angenommen, dass die Abfrage ”Riverview-Schwimmterminplan” ein Dokument mit dem Titel ”Riverview-Schwimmterminplan” zurückschickt. Es wird ferner angenommen, dass die Benutzer gewohnt sind, 30 Sekunden zu verwenden, um auf es zuzugreifen, aber nun jeder Benutzer, der das Dokument auswählt, nur ein paar Sekunden verwendet, um auf es zuzugreifen. Die Suchmaschine
125 kann diese Informationen verwenden, um zu bestimmen, dass das Dokument verbraucht ist (d. h., einen veralteten Schwimmterminplan enthält), und das Dokument entsprechend bewerten. - Zusammenfassend kann die Suchmaschine
125 eine einem Dokument zugeordnete Punktzahl wenigstens teilweise auf den Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments im Lauf der Zeit entsprechen, basierend erzeugen (oder ändern). - Domainbezogene Informationen
- Gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist, können die Informationen bezüglich einer Domain, die einem Dokument zugeordnet ist, verwendet werden, um eine dem Dokument zugeordnete Punktzahl zu erzeugen (oder zu ändern). Die Suchmaschine
125 kann z. B. die Informationen bezüglich dessen überwachen, wie ein Dokument in einem Computer-Netz (z. B. dem Internet, einem Intranet oder einem anderen Netz oder einer Datenbank von Dokumenten) gehostet ist, und diese Informationen verwenden, um das Dokument zu bewerten. - Personen, die versuchen, Suchmaschinen zu täuschen (zu spammen), verwenden oft Wegwerf- oder ”Brückenseiten”-Domains und versuchen, soviel Verkehr wie möglich zu erhalten, bevor sie erwischt werden. Informationen hinsichtlich der Rechtmäßigkeit der Domains können durch die Suchmaschine
125 verwendet werden, wenn sie die diesen Domains zugeordneten Dokumente bewertet. - Bestimmte Signale können verwendet werden, um zwischen unrechtmäßigen und rechtmäßigen Domains zu unterscheiden. Die Domains können z. B. bis zu einer Periode von 10 Jahren verlängert werden. Wertvolle (rechtmäßige) Domains sind oft für mehrere Jahre im Voraus bezahlt, während Brückenseiten- (unrechtmäßige) Domains selten für mehr als ein Jahr verwendet werden. Deshalb kann das Datum, an dem eine Domain in der Zukunft erlischt, als ein Faktor beim Vorhersagen der Rechtmäßigkeit einer Domain und folglich der ihr zugeordneten Dokumente verwendet werden.
- Außerdem oder alternativ kann der Datensatz des Domain-Namen-Servers (DNS) für eine Domain überwacht werden, um vorherzusagen, ob eine Domain rechtmäßig ist. Der DNS-Datensatz enthält die Einzelheiten, wer die Domain registriert hat, die administrativen und technischen Adressen und die Adressen der Namen-Server (d. h. der Server, die den Domain-Namen in eine IP-Adresse auflösen). Durch das Analysieren dieser Daten im Lauf der Zeit für eine Domain können unrechtmäßige Domains identifiziert werden. Die Suchmaschine
125 kann z. B. überwachen, ob während einer Zeitdauer physisch richtige Adresseninformationen vorhanden sind, ob sich die Kontaktinformationen für die Domain relativ oft ändern, ob es eine relativ große Anzahl von Änderungen zwischen verschiedenen Namen-Servern und Hosting-Unternehmen gibt usw. In einer Implementierung kann eine Liste bekannt schlechter Kontaktinformationen, Namen-Server und/oder IP-Adressen identifiziert, gespeichert und beim Vorhersagen der Rechtmäßigkeit einer Domain und folglich der ihr zugeordneten Dokumente verwendet werden. - Außerdem oder alternativ können das Alter oder andere Informationen hinsichtlich eines Namen-Servers, der einer Domain zugeordnet ist, verwendet werden, um die Rechtmäßigkeit der Domain vorherzusagen. Ein ”guter” Namen-Server kann eine Mischung verschiedener Domains von verschiedenen Registratoren besitzen und eine Historie des Hostings dieser Domains besitzen, während ein ”schlechter” Namen-Server hauptsächlich pornographische oder Brückenseiten-Domains, Domains mit Werbewörtern (ein häufiger Indikator für Spam) oder hauptsächlich Massen-Domains von einem einzigen Registrator hosten könnte oder brandneu sein könnte. Die Neuheit eines Namen-Servers könnte nicht automatisch ein negativer Faktor beim Bestimmen der Rechtmäßigkeit der zugeordneten Domain sein, aber in Kombination mit anderen Faktoren, wie z. B. den hierin beschriebenen, könnte sie es sein.
- Zusammenfassend kann die Suchmaschine
125 eine einem Dokument zugeordnete Punktzahl wenigstens teilweise auf den Informationen bezüglich einer Rechtmäßigkeit einer dem Dokument zugeordnete Domain basierend erzeugen (oder ändern). - Die Einstufungshistorie
- Gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist, können Informationen bezüglich früherer Einstufungen eines Dokuments verwendet werden, um eine dem Dokument zugeordnete Punktzahl zu erzeugen (oder zu ändern). Die Suchmaschine
125 kann z. B. die zeitlich veränderliche Einstufung eines Dokuments in Reaktion auf die der Suchmaschine125 bereitgestellten Suchabfragen überwachen. Die Suchmaschine125 kann bestimmen, dass ein Dokument, das in den Einstufungen über viele Abfragen springt, ein aktuelles Dokument sein könnte oder einen Versuch signalisieren könnte, die Suchmaschine125 zu spammen. - Folglich könnte die Menge oder die Rate, um die bzw. mit der sich ein Dokument während einer Zeitdauer in den Einstufungen bewegt, verwendet werden, um diesem Dokument zugeordnete zukünftige Punktzahlen zu beeinflussen. Bei einer Implementierung kann für jede Menge von Suchergebnissen ein Dokument in Übereinstimmung mit seiner Position in den oberen N Suchergebnissen gewichtet werden. Für N = 30 könnte eine Beispielfunktion [((N + 1) – SLOT)/N]4 sein. In diesem Fall kann ein oberes Ergebnis eine Punktzahl von 1,0 empfangen, hinunter bis zu einer Punktzahl in der Nähe von 0 für das N-te Ergebnis.
- Eine Abfragemenge (z. B., von kommerziellen Abfragen) kann wiederholt werden, und die Dokumente, die mehr als M% in den Einstufungen gewonnen haben, können markiert werden oder das prozentuale Wachstum in der Einstufung kann als ein Signal beim Bestimmen der Punktzahlen für die Dokumente verwendet werden. Die Suchmaschine
125 kann z. B. bestimmen, dass eine Abfrage wahrscheinlich kommerziell ist, falls die Durchschnittspunktzahl (die Medianpunktzahl) der oberen Ergebnisse relativ hoch ist und es eine signifikante Menge der Änderung in den oberen Ergebnissen von Monat zu Monat gibt. Die Suchmaschine125 kann außerdem den Churn als einen Hinweis auf eine kommerzielle Abfrage überwachen. Für kommerzielle Abfragen ist die Wahrscheinlichkeit von Spam höher, so dass die Suchmaschine125 die ihnen zugeordneten Dokumente entsprechend behandeln kann. - Zusätzlich zur Historie der Positionen (oder Einstufungen) der Dokumente für eine gegebene Abfrage kann die Suchmaschine
125 einen oder mehrere andere Faktoren, wie z. B. die Anzahl der Abfragen für die und die Rate mit der (zunehmend/abnehmend) ein Dokument als ein Suchergebnis im Lauf der Zeit ausgewählt wird; die Saisonabhängigkeit; die Burstiness und andere Muster im Lauf der Zeit, dass ein Dokument als ein Suchergebnis ausgewählt wird; und/oder Änderungen der Punktzahlen im Lauf der Zeit für ein URL-Abfrage-Paar, (auf einer Seiten-, Host-, Dokumenten- und/oder Domainbasis) überwachen. - Außerdem oder alternativ kann die Suchmaschine
125 eine Anzahl von dokumentenunabhängigen (z. B. URL-unabhängigen) abfragebasierten Kriterien im Lauf der Zeit überwachen. Die Suchmaschine125 kann z. B. die durchschnittliche Punktzahl unter einer oberen Menge von Ergebnissen, die in Reaktion auf eine gegebene Abfrage oder eine Menge von Abfragen erzeugt werden, überwachen und die Punktzahl dieser Menge von Ergebnissen und/oder anderen Ergebnissen, die in Reaktion auf die gegebene Abfrage oder Menge von Abfragen erzeugt werden, einstellen. Außerdem kann die Suchmaschine125 die Anzahl der für eine spezielle Anfrage oder eine Menge von Anfragen im Lauf der Zeit erzeugten Ergebnisse überwachen. Falls die Suchmaschine125 bestimmt, dass die Anzahl der Ergebnisse zunimmt oder dass es eine Änderung der Rate der Zunahme gibt (z. B. kann eine derartige Zunahme ein Hinweis auf ein ”heißes Thema” oder ein anderes Phänomen sein), kann die Suchmaschine125 diese Ergebnisse in der Zukunft höher bewerten. - Außerdem oder alternativ kann die Suchmaschine
125 die Ränge der Dokumente im Lauf der Zeit überwachen, um plötzliche Spitzen in den Rängen der Dokumente zu detektieren. Eine Spitze kann entweder ein aktuelles Phänomen (z. B. ein heißes Thema) oder einen Versuch, die Suchmaschine125 zu spammen, z. B. durch das Handeln oder Kaufen von Links, angeben. Die Suchmaschine125 kann Maßnahmen ergreifen, um Spamversuche zu verhindern, indem sie z. B. eine Hysterese verwendet, um einem Rang zu erlauben, mit einer bestimmten Rate zu wachsen. In einer weiteren Implementierung kann während eines vorgegebenen Zeitfensters dem Rang für ein gegebenes Dokument ein bestimmter maximaler Schwellenwert des Wachstums erlaubt sein. Als eine weitere Maßnahme, um ein mit einem aktuellen Phänomen in Beziehung stehendes Dokument von einem Spamdokument zu unterscheiden, kann die Suchmaschine125 die Erwähnungen des Dokuments in Nachrichtenartikeln, Diskussionsgruppen usw. basierend auf der Theorie betrachten, dass Spamdokumente z. B. in den Nachrichten nicht erwähnt werden. Irgendeine oder eine Kombination dieser Techniken kann verwendet werden, um Spamversuche einzuschränken. - Es kann möglich sein, dass die Suchmaschine
125 Ausnahmen für Dokumente macht, von denen bestimmt wird, dass sie in irgendeiner Beziehung autoritativ sind, wie z. B. Regierungsdokumente, Web-Verzeichnisse (z. B. Yahoo) und Dokumente, die im Lauf der Zeit einen relativ beständigen und hohen Rang gezeigt haben. Wenn z. B. eine ungewöhnliche Spitze in der Anzahl oder der Rate der Zunahme der Links zu einem autoritativen Dokument auftritt, dann kann die Suchmaschine125 erwägen, dass ein derartiges Dokument kein Spam ist, und folglich einen relativ hohen oder sogar keinen Schwellenwert für (das Wachstum) seines Rangs (im Lauf der Zeit) erlauben. - Außerdem oder alternativ kann die Suchmaschine
125 signifikante Abfälle in den Rängen der Dokumente als einen Hinweis betrachten, dass diese Dokumente ”nicht mehr gefragt” oder veraltet sind. Falls z. B. der Rang eines Dokuments im Lauf der Zeit signifikant abfällt, kann die Suchmaschine125 das Dokument als veraltet betrachten und das Dokument entsprechend bewerten. - Zusammenfassend kann die Suchmaschine
125 eine einem Dokument zugeordnete Punktzahl wenigstens teilweise auf den Informationen bezüglich früherer Einstufungen des Dokuments basierend erzeugen (oder ändern). - Vom Benutzer aufrechterhaltene/erzeugte Daten
- Gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist, können vom Benutzer aufrechterhaltene oder erzeugte Daten verwendet werden, um eine einem Dokument zugeordnete Punktzahl zu erzeugen (oder zu ändern). Die Suchmaschine
125 kann z. B. die durch einen Benutzer aufrechterhaltenen oder erzeugten Daten, wie z. B. ”Lesezeichen”, ”Favoriten” oder andere Typen der Daten, die irgendeinen Hinweis auf Dokumente, die von dem Benutzer bevorzugt werden oder für den Benutzer von Interesse sind, bereitstellen können, überwachen. Die Suchmaschine125 kann diese Daten entweder direkt (z. B. über einen Browser-Assistenten) oder indirekt (z. B. über einen Browser) erhalten. Die Suchmaschine125 kann dann im Lauf der Zeit eine Anzahl von Lesezeichen/Favoriten, denen ein Dokument zugeordnet ist, analysieren, um die Wichtigkeit des Dokuments zu bestimmen. - Die Suchmaschine
125 kann außerdem Aufwärts- und Abwärtstrends, um ein Dokument (oder spezifischer einen Weg zu dem Dokument) aus der Liste der Lesezeichen/Favoriten hinzuzufügen oder zu entfernen, die Rate, mit der das Dokument zu der Liste der Lesezeichen/Favoriten hinzugefügt oder aus ihr entfernt wird, und/oder ob das Dokument zur Liste der Lesezeichen/Favoriten hinzugefügt wird, aus ihr gelöscht wird oder durch sie auf es zugegriffen wird, analysieren. Falls eine Anzahl von Benutzern im Lauf der Zeit ein spezielles Dokument zu ihren Listen der Lesezeichen/Favoriten hinzufügt oder durch derartige Listen oft auf das Dokument zugreift, kann dies als ein Hinweis betrachtet werden, dass das Dokument relativ wichtig ist. Falls andererseits eine Anzahl von Benutzern abnehmend auf ein Dokument, das in ihrer Liste der Lesezeichen/Favoriten angegeben ist, zugreift oder den Weg zu einem derartigen Dokument zunehmend aus ihren Listen löscht/ihn ersetzt, kann dies als ein Hinweis genommen werden, dass das Dokument veraltet, unbeliebt usw. ist. Die Suchmaschine125 kann dann die Dokumente entsprechend bewerten. - In einer alternativen Implementierung können andere Typen der Benutzerdaten, die eine Zunahme oder Abnahme des Benutzerinteresses an einem speziellen Dokument im Lauf der Zeit angeben können, durch die Suchmaschine
125 verwendet werden, um das Dokument zu bewerten. Die den Benutzern zugeordneten ”temp-” oder Cache-Dateien könnten z. B. durch die Suchmaschine125 überwacht werden, um zu identifizieren, ob es eine Zunahme oder eine Abnahme gibt, dass ein Dokument im Lauf der Zeit hinzugefügt wird. Ähnlich könnten die einem speziellen Dokument zugeordneten Cookies durch die Suchmaschine125 überwacht werden, um zu bestimmen, ob es einen Aufwärts- oder Abwärtstrend im Interesse an dem Dokument gibt. - Zusammenfassend kann die Suchmaschine
125 eine einem Dokument zugeordnete Punktzahl wenigstens teilweise auf den durch den Benutzer erzeugten oder aufrechterhaltenen Daten basierend erzeugen (oder ändern). - Eindeutige Wörter, Bigramme und Redewendungen im Ankertext
- Gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist, können Informationen hinsichtlich eindeutiger Wörter, Bigramme und Redewendungen im Ankertext verwendet werden, um eine einem Dokument zugeordnete Punktzahl zu erzeugen (oder zu ändern). Die Suchmaschine
125 kann z. B. Web-Kurven (oder Link-Kurven) und ihr Verhalten im Lauf der Zeit überwachen und diese Informationen für das Bewerten, die Spamdetektion oder andere Zwecke verwenden. Natürlich entwickelte Web-Kurven umfassen typischerweise unabhängige Entscheidungen. Synthetisch erzeugte Web-Kurven, die normalerweise ein Hinweis auf eine Spamabsicht sind, basieren auf koordinierten Entscheidungen, was verursacht, dass das Profil des Wachstums der Ankerwörter/Bigramme/Redewendungen wahrscheinlich relativ spitz ist. - Ein Grund für derartige Spitzen kann die Hinzufügung einer großen Anzahl völlig gleiche Anker von vielen Dokumenten sein. Eine weitere Möglichkeit kann die Hinzufügung von absichtlich verschiedenen Ankern von vielen Dokumenten sein. Die Suchmaschine
125 kann die Anker überwachen und sie in die Bewertung eines Dokuments einbeziehen, auf das ihre zugeordneten Links zeigen. Die Suchmaschine125 kann z. B. die Auswirkung verdächtiger Anker auf die Punktzahl des zugeordneten Dokuments nach oben begrenzen. Alternativ kann die Suchmaschine125 einen kontinuierlichen Maßstab für die Wahrscheinlichkeit einer synthetischen Erzeugung verwenden und einen multiplikativen Faktor ableiten, um die Punktzahl für das Dokument zu skalieren. - Zusammenfassend kann die Suchmaschine
125 eine einem Dokument zugeordnete Punktzahl wenigstens teilweise auf den Informationen bezüglich eindeutiger Wörter, Bigramme und Redewendungen im Ankertext, der einem oder mehreren Links zugeordnet ist, die auf das Dokument zeigen, basierend erzeugen (oder ändern). - Die Verlinkung unabhängiger Peers
- Gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist, können Informationen hinsichtlich der Verlinkung unabhängiger Peers (d. h. von beziehungslosen Dokumenten) verwendet werden, um eine einem Dokument zugeordnete Punktzahl zu erzeugen (oder zu ändern).
- Ein plötzliches Wachstum der Anzahl offensichtlich unabhängiger Peers, eingehend und/oder ausgehend, mit einer großen Anzahl von Links zu einzelnen Dokumenten kann eine potentiell synthetische Web-Kurve angeben, die ein Indikator eines Spamversuchs ist. Dieser Hinweis kann verstärkt werden, falls das Wachstum dem Ankertext entspricht, der ungewöhnlich kohärent oder widersprechend ist. Diese Informationen können verwendet werden, um die Auswirkung derartiger Links zurückzustufen, wenn sie mit einer linkbasierten Bewertungstechnik verwendet werden, entweder als eine binäre Entscheidungseinzelheit (z. B. Zurückstufen der Punktzahl um einen festen Betrag) oder als ein multiplikativer Faktor.
- Zusammenfassend kann die Suchmaschine
125 eine einem Dokument zugeordnete Punktzahl wenigstens teilweise auf den Informationen bezüglich der Verlinkung unabhängiger Peers basierend erzeugen (oder ändern). - Die Dokumententhemen
- Gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist, können Informationen hinsichtlich der Dokumententhemen verwendet werden, um eine einem Dokument zugeordnete Punktzahl zu erzeugen (oder zu ändern). Die Suchmaschine
125 kann z. B. eine Themenextraktion (z. B. durch Kategorisierung, URL-Analyse, Inhaltsanalyse, Cluster-Bildung, Zusammenfassung, eine Menge eindeutiger Wörter mit niedriger Häufigkeit oder irgendeinen anderen Typ der Themenextraktion) ausführen. Die Suchmaschine125 kann dann das Thema (die Themen) eines Dokuments im Lauf der Zeit überwachen und diese Informationen für Bewertungszwecke verwenden. - Eine signifikante Änderung im Lauf der Zeit in der Menge der Themen, die einem Dokument zugeordnet ist, kann angeben, dass das Dokument geänderte Besitzer hat und vorhergehende Dokumentenindikatoren, wie z. B. die Punktzahl, der Ankertext usw., nicht länger zuverlässig sind. Ähnlich könnte eine Spitze in der Anzahl der Themen Spam angeben. Falls z. B. ein spezielles Dokument während dessen, was als eine ”stabile” Zeitdauer betrachtet werden kann, einer Menge von einem oder mehreren Themen zugeordnet ist, und dann eine (plötzliche) Spitze in der Anzahl der Themen, die dem Dokument zugeordnet sind, auftritt, kann dies ein Hinweis sein, dass das Dokument als ein ”Brückenseiten”-Dokument übernommen worden ist. Ein weiterer Hinweis kann das Verschwinden der dem Dokument zugeordneten ursprünglichen Themen sein. Wenn eine oder mehrere dieser Situationen detektiert werden, dann kann die Suchmaschine
125 die relative Punktzahl derartiger Dokument und/oder der Links, des Ankertextes oder anderer Daten, die dem Dokument zugeordnet sind, verringern. - Zusammenfassend kann die Suchmaschine
125 eine einem Dokument zugeordnete Punktzahl wenigstens teilweise auf den Änderungen eines oder mehrerer Themen, die dem Dokument zugeordnet sind, basierend erzeugen (oder ändern). - EINE BEISPIELHAFTE VERARBEITUNG
-
4 ist ein Ablaufplan einer beispielhaften Verarbeitung für das Bewerten von Dokumenten gemäß einer Implementierung, die mit den Prinzipien der Erfindung konsistent ist. Die Verarbeitung kann mit dem Server120 beginnen, der die Dokumente identifiziert (Handlung410 ). Die Dokumente können z. B. ein oder mehrere Dokumente, die einer Suchabfrage zugeordnet sind, enthalten, wie z. B. Dokumente, die als für die Suchabfrage relevant identifiziert worden sind. Alternativ können die Dokumente ein oder mehrere Dokumente in einem Körper oder einem Lager von Dokumenten enthalten, die von irgendeiner Suchabfrage unabhängig sind (z. B. Dokumente, die durch das Crawling eines Netzes identifiziert und in einem Lager gespeichert worden sind). - Die Suchmaschine
125 kann die den identifizierten Dokumenten zugeordneten Historiedaten erhalten (Handlung420 ). Wie oben beschrieben worden ist, können die Historiedaten verschiedene Formen annehmen. Die Historiedaten können z. B. Daten bezüglich der Anfangsdaten des Dokuments; Aktualisierungen/Änderungen der Dokumenteninhalte; eine Abfrageanalyse; linkbasierte Kriterien; einen Ankertext; den Verkehr; das Benutzerverhalten; domänenbezogene Informationen; die Einstufungshysterie; vom Benutzer aufrechterhalten/erzeugte Daten (z. B. Lesezeichen und/oder Favoriten); eindeutige Wörter, Bigramme und Redewendungen im Ankertext; die Verlinkung unabhängiger Peers; und/oder Dokumententhemen enthalten. Die Suchmaschine125 kann eine oder eine Kombination dieser Arten der Historiedaten erhalten. - Die Suchmaschine
125 kann dann die identifizierten Dokumente wenigstens teilweise basierend auf den Historiedaten bewerten (Handlung430 ). Wenn die identifizierten Dokumente einer Suchabfrage zugeordnet sind, kann die Suchmaschine125 außerdem Relevanz-Punktzahlen für die Dokumente z. B. darauf basierend erzeugen, wie relevant sie für die Suchabfrage sind. Die Suchmaschine125 kann dann die Historie-Punktzahlen mit den Relevanz-Punktzahlen kombinieren, um die Gesamtpunktzahlen für die Dokumente zu erhalten. Anstatt die Punktzahlen zu kombinieren, kann die Suchmaschine125 die Relevanz-Punktzahlen für die Dokumente basierend auf den Historiedaten ändern und dadurch die Punktzahlen erhöhen oder verringern oder in einigen Fällen die Punktzahlen dieselben lassen. Alternativ kann die Suchmaschine125 die Dokumente basierend auf den Historiedaten bewerten, ohne die Relevanz-Punktzahlen zu erzeugen. In jedem Fall kann die Suchmaschine125 die Dokumente unter Verwendung eines oder einer Kombination aus den Typen der Historiedaten bewerten. - Wenn die identifizierten Dokumente einer Suchabfrage zugeordnet sind, kann die Suchmaschine
125 außerdem die Suchergebnisse aus den bewerteten Dokumenten bilden. Die Suchmaschine125 kann z. B. die Dokumente basierend auf ihren Punktzahlen sortieren. Die Suchmaschine125 kann dann Bezüge zu den Dokumenten bilden, wobei ein Bezug einen Titel des Dokuments (der einen Hypertext-Link enthalten kann, der den Benutzer, wenn er ausgewählt wird, zu dem tatsächlichen Dokument leitet) und einen Ausschnitt (d. h. ein Textexzerpt) aus dem Dokument enthalten könnte. In weiteren Implementierungen können die Bezüge anders gebildet werden. Die Suchmaschine125 kann die Bezüge, die einer Anzahl der Dokumente mit den oberen Punktzahlen (z. B. eine vorgegebene Anzahl der Dokumente, die Dokumente mit Punktzahlen über einem Schwellenwert, alle Dokumente usw.) entsprechen, einem Benutzer, der die Suchabfrage abgeschickt hat, präsentieren. - SCHLUSSFOLGERUNG
- Die Systeme, computerlesbaren Medien und Server die mit den Prinzipien der Erfindung konsistent sind, können Historiedaten verwenden, um Dokumente zu bewerten und Suchergebnisse in hoher Qualität zu bilden.
- Die vorhergehende Beschreibung der bevorzugten Ausführungsformen der vorliegenden Erfindung schafft eine Veranschaulichung und eine Beschreibung, sie ist aber nicht vorgesehen, erschöpfend zu sein oder die Erfindung auf die genaue offenbarte Form einzuschränken. Angesichts der obigen Lehren sind Modifikationen und Variationen möglich oder können aus der Praxis der Erfindung erlangt werden. Während eine Folge von Handlungen bezüglich
4 beschrieben worden ist, kann z. B. die Reihenfolge der Handlungen in weiteren Implementierungen, die mit den Prinzipien der Erfindung konsistent sind, modifiziert werden. Außerdem können unabhängige Handlungen parallel ausgeführt werden. - Ferner ist allgemein beschrieben worden, dass der Server
120 das meiste, wenn nicht alles der bezüglich der Verarbeitung nach4 beschriebenen Handlungen ausführt. In einer weiteren Implementierung, die mit den Prinzipien der Erfindung konsistent ist, können eine oder mehrere oder alle der Handlungen durch eine weitere Entität, wie z. B. einen weiteren Server130 und/oder140 oder den Client110 ausgeführt werden. - Es ist außerdem für einen Durchschnittsfachmann auf dem Gebiet klar, dass die Aspekte der Erfindung, wie sie oben beschrieben worden sind, in vielen verschiedenen Formen von Software, Firmware und Hardware in den in den Figuren veranschaulichten Implementierungen implementiert sein können. Der tatsächliche Software-Code oder die spezialisierte Steuer-Hardware, die verwendet werden, um die Aspekte zu implementieren, die mit den Prinzipien der Erfindung konsistent sind, schränken die vorliegende Erfindung nicht ein. Folglich sind der Betrieb und das Verhalten der Aspekte ohne Bezugnahme auf den spezifischen Software-Code beschrieben worden – es ist selbstverständlich, dass ein Durchschnittsfachmann auf dem Gebiet basierend auf der Beschreibung hierin die Software und die Steuer-Hardware konstruieren könnte, um die Aspekte zu implementieren.
- ZITATE ENTHALTEN IN DER BESCHREIBUNG
- Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
- Zitierte Patentliteratur
-
- US 6285999 [0037, 0064]
Claims (33)
- Computerlesbares Medium, das umfasst: Computerprogrammcode, der, wenn er durch einen oder mehrere Prozessoren ausgeführt wird, den einen oder die mehreren Prozessoren veranlasst: ein Dokument basierend auf einer empfangenen Suchabfrage zu identifizieren; ein Maß der Relevanz des Dokuments für die Suchabfrage zu bestimmen; einen oder mehrere linkgestützte Faktoren, die den Links zu dem Dokument zugeordnet sind, zu identifizieren, Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich eines Dokuments während der Zeit entsprechen, zu identifizieren, eine Punktzahl für das Dokument basierend auf dem Maß der Relevanz des Dokuments für die Suchabfrage, dem einen oder den mehreren linkgestützten Faktoren, die den Links zu dem Dokument zugeordnet sind, und den Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments entsprechen, zu erzeugen; und das Dokument hinsichtlich wenigstens eines weiteren Dokuments basierend auf der Punktzahl einzustufen.
- Computerlesbares Medium nach Anspruch 1, wobei wenigstens einer des einen oder der mehreren linkgestützten Faktoren auf den Maßen des Vertrauens der Dokumente, die Links zu dem Dokument enthalten, basiert.
- Computerlesbares Medium nach Anspruch 1, wobei wenigstens einer des einen oder der mehreren linkgestützten Faktoren auf den Maßen der Frische der Dokumente, die Links zu dem Dokument enthalten, basiert.
- Computerlesbares Medium nach Anspruch 1, wobei wenigstens einer des einen oder der mehreren linkgestützten Faktoren auf einem Maß der Maßgeblichkeit von einem oder mehreren Dokumenten, die Links zu dem Dokument enthalten, basiert.
- Computerlesbares Medium nach Anspruch 1, wobei der Computerprogrammcode, wenn er durch den einen oder die mehreren Prozessoren ausgeführt wird, den einen oder die mehreren Prozessoren ferner veranlasst: eine Menge des Verkehrs, die dem Dokument während der Zeit zugeordnet ist, zu identifizieren; wobei der Computerprogrammcode zum Erzeugen der Punktzahl für das Dokument Computerprogrammcode enthält, der, wenn er durch den einen oder die mehreren Prozessoren ausgeführt wird, den einen oder die mehreren Prozessoren veranlasst: eine Punktzahl für das Dokument basierend auf dem Maß der Relevanz des Dokuments für die Suchabfrage, dem einen oder den mehreren linkgestützten Faktoren, den Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments entsprechen, und der Menge des Verkehrs, die dem Dokument zugeordnet ist, zu erzeugen.
- Computerlesbares Medium nach Anspruch 5, wobei sich die Menge des Verkehrs auf die zeitlich veränderlichen Eigenschaften des Verkehrs zu dem Dokument durch einen oder mehrere Benutzer bezieht.
- Computerlesbares Medium nach Anspruch 5, wobei sich die Menge des Verkehrs auf die zeitlich veränderlichen Eigenschaften des Werbeverkehrs für das Dokument bezieht.
- Computerlesbares Medium nach Anspruch 1, wobei der Computerprogrammcode, wenn er durch den einen oder die mehreren Prozessoren ausgeführt wird, den einen oder die mehreren Prozessoren ferner veranlasst: ein Anfangsdatum zu identifizieren, das dem Dokument zugeordnet ist, wobei der Computerprogrammcode zum Erzeugen der Punktzahl für das Dokument Computerprogrammcode enthält, der, wenn er durch den einen oder die mehreren Prozessoren ausgeführt wird, den einen oder die mehreren Prozessoren veranlasst: eine Punktzahl für das Dokument basierend auf dem Maß der Relevanz des Dokuments für die Suchabfrage, dem einen oder den mehreren linkgestützten Faktoren, den Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments entsprechen, und dem Anfangsdatum, das dem Dokument zugeordnet ist, zu erzeugen.
- Computerlesbares Medium nach Anspruch 8, wobei das Anfangsdatum auf wenigstens einem aus dem Folgenden basiert: einem Datum, an dem eine Suchmaschine zuerst das Dokument in Erfahrung bringt oder das Dokument indexiert, einem Datum, an dem eine Suchmaschine zuerst einen Link zu dem Dokument entdeckt, einem Registrierungsdatum einer Domain, die dem Dokument zugeordnet ist, einem Datum, an dem in einem weiteren Dokument zuerst auf das Dokument Bezug genommen wird, einem Datum, an dem das Dokument wenigstens eine Schwellenmenge von Seiten enthält, oder einem Zeitstempel, der dem Dokument zugeordnet ist.
- Computerlesbares Medium nach Anspruch 1, wobei die Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments entsprechen, Informationen hinsichtlich einer Anzahl enthalten, wie oft das Dokument ausgewählt wird, wenn das Dokument in einer Menge von Suchergebnissen enthalten ist.
- Computerlesbares Medium nach Anspruch 1, wobei der Computerprogrammcode, wenn er durch den einen oder die mehreren Prozessoren ausgeführt wird, den einen oder die mehreren Prozessoren ferner veranlasst: die Informationen hinsichtlich einer Menge von Abfragen, für die das Dokument als ein Suchergebnis während der Zeit ausgewählt wird, zu überwachen, die Informationen hinsichtlich einer Rate, mit der das Dokument als ein Suchergebnis während der Zeit ausgewählt wird, zu überwachen, wobei der Computerprogrammcode zum Erzeugen der Punktzahl für das Dokument Computerprogrammcode enthält, der, wenn er durch den einen oder die mehreren Prozessoren ausgeführt wird, den einen oder die mehreren Prozessoren veranlasst: eine Punktzahl für das Dokument basierend auf dem Maß der Relevanz des Dokuments für die Suchabfrage, dem einen oder den mehreren linkgestützten Faktoren, den Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments entsprechen, den Informationen hinsichtlich der Menge von Abfragen, für die das Dokument als ein Suchergebnis während der Zeit ausgewählt wird, und den Informationen hinsichtlich der Rate, mit der das Dokument als ein Suchergebnis während der Zeit ausgewählt wird, zu erzeugen.
- System, das umfasst: einen oder mehrere Server, die konfiguriert sind: ein Dokument basierend auf einer empfangenen Suchabfrage zu identifizieren; ein Maß der Relevanz des Dokuments für die Suchabfrage zu bestimmen; einen oder mehrere linkgestützte Faktoren, die den Links zu dem Dokument zugeordnet sind, zu identifizieren, Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich eines Dokuments während der Zeit entsprechen, zu identifizieren, eine Punktzahl für das Dokument basierend auf dem Maß der Relevanz des Dokuments für die Suchabfrage, dem einen oder den mehreren linkgestützten Faktoren, die den Links zu dem Dokument zugeordnet sind, und den Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments entsprechen, zu erzeugen; und das Dokument hinsichtlich wenigstens eines weiteren Dokuments basierend auf der Punktzahl einzustufen.
- System nach Anspruch 12, wobei wenigstens einer des einen oder der mehreren linkgestützten Faktoren auf den Maßen des Vertrauens der Dokumente, die Links zu dem Dokument enthalten, basiert.
- System nach Anspruch 12, wobei wenigstens einer des einen oder der mehreren linkgestützten Faktoren auf den Maßen der Frische der Dokumente, die Links zu dem Dokument enthalten, basiert.
- System nach Anspruch 12, wobei wenigstens einer des einen oder der mehreren linkgestützten Faktoren auf einem Maß der Maßgeblichkeit von einem oder mehreren Dokumenten, die Links zu dem Dokument enthalten, basiert.
- System nach Anspruch 12, wobei der eine oder die mehreren Server ferner konfiguriert sind, um eine Menge des Verkehrs, die dem Dokument während der Zeit zugeordnet ist, zu identifizieren; wobei, wenn sie die Punktzahl für das Dokument erzeugen, der eine oder die mehreren Server konfiguriert sind: eine Punktzahl für das Dokument basierend auf dem Maß der Relevanz des Dokuments für die Suchabfrage, dem einen oder den mehreren linkgestützten Faktoren, den Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments entsprechen, und der Menge des Verkehrs, die dem Dokument zugeordnet ist, zu erzeugen.
- System nach Anspruch 16, wobei sich die Menge des Verkehrs auf die zeitlich veränderlichen Eigenschaften des Verkehrs zu dem Dokument durch einen oder mehrere Benutzer bezieht.
- System nach Anspruch 16, wobei sich die Menge des Verkehrs auf die zeitlich veränderlichen Eigenschaften des Werbeverkehrs für das Dokument bezieht.
- System nach Anspruch 12, wobei der eine oder die mehreren Server ferner konfiguriert sind, ein Anfangsdatum zu identifizieren, das dem Dokument zugeordnet ist, wobei, wenn sie die Punktzahl für das Dokument erzeugen, der eine oder die mehreren Server konfiguriert sind: eine Punktzahl für das Dokument basierend auf dem Maß der Relevanz des Dokuments für die Suchabfrage, dem einen oder den mehreren linkgestützten Faktoren, den Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments entsprechen, und dem Anfangsdatum, das dem Dokument zugeordnet ist, zu erzeugen.
- System nach Anspruch 19, wobei das Anfangsdatum auf wenigstens einem aus dem Folgenden basiert: einem Datum, an dem eine Suchmaschine zuerst das Dokument in Erfahrung bringt oder das Dokument indexiert, einem Datum, an dem eine Suchmaschine zuerst einen Link zu dem Dokument entdeckt, einem Registrierungsdatum einer Domain, die dem Dokument zugeordnet ist, einem Datum, an dem in einem weiteren Dokument zuerst auf das Dokument Bezug genommen wird, einem Datum, an dem das Dokument wenigstens eine Schwellenmenge von Seiten enthält, oder einem Zeitstempel, der dem Dokument zugeordnet ist.
- System nach Anspruch 12, wobei die Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments entsprechen, Informationen hinsichtlich einer Anzahl enthalten, wie oft das Dokument ausgewählt wird, wenn das Dokument in einer Menge von Suchergebnissen enthalten ist.
- System nach Anspruch 12, wobei der eine oder die mehreren Server ferner konfiguriert sind: die Informationen hinsichtlich einer Menge von Abfragen, für die das Dokument als ein Suchergebnis während der Zeit ausgewählt wird, zu überwachen, die Informationen hinsichtlich einer Rate, mit der das Dokument als ein Suchergebnis während der Zeit ausgewählt wird, zu überwachen, wobei, wenn sie die Punktzahl für das Dokument erzeugen, der eine oder die mehreren Server konfiguriert sind: eine Punktzahl für das Dokument basierend auf dem Maß der Relevanz des Dokuments für die Suchabfrage, dem einen oder den mehreren linkgestützten Faktoren, den Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments entsprechen, den Informationen hinsichtlich der Menge von Abfragen, für die das Dokument als ein Suchergebnis während der Zeit ausgewählt wird, und den Informationen hinsichtlich der Rate, mit der das Dokument als ein Suchergebnis während der Zeit ausgewählt wird, zu erzeugen.
- Server, der umfasst: Mittel zum Identifizieren eines Dokuments basierend auf einer empfangenen Suchabfrage; Mittel zum Bestimmen eines Maßes der Relevanz des Dokuments für die Suchabfrage; Mittel zum Identifizieren eines oder mehrerer linkgestützter Faktoren, die den Links zu dem Dokument zugeordnet sind; Mittel zum Identifizieren der Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments während der Zeit entsprechen; Mittel zum Erzeugen einer Punktzahl für das Dokument basierend auf dem Maß der Relevanz des Dokuments für die Suchabfrage, dem einen oder den mehreren linkgestützten Faktoren, die den Links zu dem Dokument zugeordnet sind, und den Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments entsprechen; und Mittel zum Einstufen des Dokuments hinsichtlich wenigstens eines weiteren Dokuments basierend auf der Punktzahl.
- Server nach Anspruch 23, wobei wenigstens einer des einen oder der mehreren linkgestützzten Faktoren auf den Maßen des Vertrauens der Dokumente, die Links zu dem Dokument enthalten, basiert.
- Server nach Anspruch 23, wobei wenigstens einer des einen oder der mehreren linkgestützten Faktoren auf den Maßen der Frische der Dokumente, die Links zu dem Dokument enthalten, basiert.
- Server nach Anspruch 23, wobei wenigstens einer des einen oder der mehreren linkgestützten Faktoren auf einem Maß der Maßgeblichkeit von einem oder mehreren Dokumenten, die Links zu dem Dokument enthalten, basiert.
- Server nach Anspruch 23, der ferner umfasst: Mittel zum Identifizieren einer Menge des Verkehrs, die dem Dokument während der Zeit zugeordnet ist; wobei die Mittel zum Erzeugen der Punktzahl für das Dokument enthalten: Mittel zum Erzeugen einer Punktzahl für das Dokument basierend auf dem Maß der Relevanz des Dokuments für die Suchabfrage, dem einen oder den mehreren linkgestützten Faktoren, den Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments entsprechen, und der Menge des Verkehrs, die dem Dokument zugeordnet ist.
- Server nach Anspruch 27, wobei sich die Menge des Verkehrs auf die zeitlich veränderlichen Eigenschaften des Verkehrs zu dem Dokument durch einen oder mehrere Benutzer bezieht.
- Server nach Anspruch 27, wobei sich die Menge des Verkehrs auf die zeitlich veränderlichen Eigenschaften des Werbeverkehrs für das Dokument bezieht.
- Server nach Anspruch 23, der ferner umfasst: Mittel zum Identifizieren eines Anfangsdatums, das dem Dokument zugeordnet ist, wobei die Mittel zum Erzeugen der Punktzahl für das Dokument enthalten: Mittel zum Erzeugen einer Punktzahl für das Dokument basierend auf dem Maß der Relevanz des Dokuments für die Suchabfrage, dem einen oder den mehreren linkgestützten Faktoren, den Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments entsprechen, und dem Anfangsdatum, das dem Dokument zugeordnet ist.
- Server nach Anspruch 30, wobei das Anfangsdatum auf wenigstens einem aus dem Folgenden basiert: einem Datum, an dem eine Suchmaschine zuerst das Dokument in Erfahrung bringt oder das Dokument indexiert, einem Datum, an dem eine Suchmaschine zuerst einen Link zu dem Dokument entdeckt, einem Registrierungsdatum einer Domain, die dem Dokument zugeordnet ist, einem Datum, an dem in einem weiteren Dokument zuerst auf das Dokument Bezug genommen wird, einem Datum, an dem das Dokument wenigstens eine Schwellenmenge von Seiten enthält, oder einem Zeitstempel, der dem Dokument zugeordnet ist.
- Server nach Anspruch 23, wobei die Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments entsprechen, Informationen hinsichtlich einer Anzahl enthalten, wie oft das Dokument ausgewählt wird, wenn das Dokument in einer Menge von Suchergebnissen enthalten ist.
- Server nach Anspruch 23, der ferner umfasst: Mittel zum Überwachen der Informationen hinsichtlich einer Menge von Abfragen, für die das Dokument als ein Suchergebnis während der Zeit ausgewählt wird, Mittel zum Überwachen der Informationen hinsichtlich einer Rate, mit der das Dokument als ein Suchergebnis während der Zeit ausgewählt wird, wobei die Mittel zum Erzeugen der Punktzahl für das Dokument enthalten: Mittel zum Erzeugen einer Punktzahl für das Dokument basierend auf dem Maß der Relevanz des Dokuments für die Suchabfrage, dem einen oder den mehreren linkgestützten Faktoren, den Informationen, die dem einzelnen oder dem gesamten Benutzerverhalten bezüglich des Dokuments entsprechen, den Informationen hinsichtlich der Menge von Abfragen, für die das Dokument als ein Suchergebnis während der Zeit ausgewählt wird, und den Informationen hinsichtlich der Rate, mit der das Dokument als ein Suchergebnis während der Zeit ausgewählt wird.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US50761703P | 2003-09-30 | 2003-09-30 | |
US60/507,617 | 2003-09-30 | ||
US10/748,664 | 2003-12-31 | ||
US10/748,664 US7346839B2 (en) | 2003-09-30 | 2003-12-31 | Information retrieval based on historical data |
Publications (1)
Publication Number | Publication Date |
---|---|
DE202004021885U1 true DE202004021885U1 (de) | 2012-03-02 |
Family
ID=34381362
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE200420021885 Expired - Lifetime DE202004021885U1 (de) | 2003-09-30 | 2004-09-15 | System zur Informationswiedergewinnung basierend auf historischen Daten |
DE200420021886 Expired - Lifetime DE202004021886U1 (de) | 2003-09-30 | 2004-09-15 | System zur Informationswiedergewinnung basierend auf historischen Daten |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE200420021886 Expired - Lifetime DE202004021886U1 (de) | 2003-09-30 | 2004-09-15 | System zur Informationswiedergewinnung basierend auf historischen Daten |
Country Status (8)
Country | Link |
---|---|
US (19) | US7346839B2 (de) |
EP (5) | EP2416263A3 (de) |
JP (3) | JP2007507798A (de) |
CN (1) | CN1879107B (de) |
AU (1) | AU2004277678C1 (de) |
CA (2) | CA2757550A1 (de) |
DE (2) | DE202004021885U1 (de) |
WO (1) | WO2005033978A1 (de) |
Families Citing this family (543)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7398271B1 (en) | 2001-04-16 | 2008-07-08 | Yahoo! Inc. | Using network traffic logs for search enhancement |
US7249034B2 (en) | 2002-01-14 | 2007-07-24 | International Business Machines Corporation | System and method for publishing a person's affinities |
US8590013B2 (en) | 2002-02-25 | 2013-11-19 | C. S. Lee Crawford | Method of managing and communicating data pertaining to software applications for processor-based devices comprising wireless communication circuitry |
US7743045B2 (en) * | 2005-08-10 | 2010-06-22 | Google Inc. | Detecting spam related and biased contexts for programmable search engines |
US7716199B2 (en) | 2005-08-10 | 2010-05-11 | Google Inc. | Aggregating context data for programmable search engines |
US7693830B2 (en) * | 2005-08-10 | 2010-04-06 | Google Inc. | Programmable search engine |
US20070038614A1 (en) * | 2005-08-10 | 2007-02-15 | Guha Ramanathan V | Generating and presenting advertisements based on context data for programmable search engines |
US7130844B2 (en) * | 2002-10-31 | 2006-10-31 | International Business Machines Corporation | System and method for examining, calculating the age of an document collection as a measure of time since creation, visualizing, identifying selectively reference those document collections representing current activity |
US7725452B1 (en) | 2003-07-03 | 2010-05-25 | Google Inc. | Scheduler for search engine crawler |
US8707312B1 (en) | 2003-07-03 | 2014-04-22 | Google Inc. | Document reuse in a search engine crawler |
US8548995B1 (en) * | 2003-09-10 | 2013-10-01 | Google Inc. | Ranking of documents based on analysis of related documents |
US7505964B2 (en) | 2003-09-12 | 2009-03-17 | Google Inc. | Methods and systems for improving a search ranking using related queries |
US7797316B2 (en) | 2003-09-30 | 2010-09-14 | Google Inc. | Systems and methods for determining document freshness |
US7693827B2 (en) * | 2003-09-30 | 2010-04-06 | Google Inc. | Personalization of placed content ordering in search results |
US7346839B2 (en) | 2003-09-30 | 2008-03-18 | Google Inc. | Information retrieval based on historical data |
US7231399B1 (en) | 2003-11-14 | 2007-06-12 | Google Inc. | Ranking documents based on large data sets |
US8521725B1 (en) | 2003-12-03 | 2013-08-27 | Google Inc. | Systems and methods for improved searching |
US8676790B1 (en) | 2003-12-05 | 2014-03-18 | Google Inc. | Methods and systems for improving search rankings using advertising data |
US7302645B1 (en) | 2003-12-10 | 2007-11-27 | Google Inc. | Methods and systems for identifying manipulated articles |
US7548968B1 (en) | 2003-12-10 | 2009-06-16 | Markmonitor Inc. | Policing internet domains |
US20050149388A1 (en) * | 2003-12-30 | 2005-07-07 | Scholl Nathaniel B. | Method and system for placing advertisements based on selection of links that are not prominently displayed |
US8655727B2 (en) | 2003-12-30 | 2014-02-18 | Amazon Technologies, Inc. | Method and system for generating and placing keyword-targeted advertisements |
US7676553B1 (en) * | 2003-12-31 | 2010-03-09 | Microsoft Corporation | Incremental web crawler using chunks |
US7461089B2 (en) * | 2004-01-08 | 2008-12-02 | International Business Machines Corporation | Method and system for creating profiling indices |
US8010459B2 (en) * | 2004-01-21 | 2011-08-30 | Google Inc. | Methods and systems for rating associated members in a social network |
US8577893B1 (en) * | 2004-03-15 | 2013-11-05 | Google Inc. | Ranking based on reference contexts |
US9104689B2 (en) * | 2004-03-17 | 2015-08-11 | International Business Machines Corporation | Method for synchronizing documents for disconnected operation |
US7584221B2 (en) * | 2004-03-18 | 2009-09-01 | Microsoft Corporation | Field weighting in text searching |
US7536382B2 (en) * | 2004-03-31 | 2009-05-19 | Google Inc. | Query rewriting with entity detection |
US20050234877A1 (en) * | 2004-04-08 | 2005-10-20 | Yu Philip S | System and method for searching using a temporal dimension |
US7539674B2 (en) * | 2004-04-08 | 2009-05-26 | Yahoo! Inc. | Systems and methods for adaptive scheduling of references to documents |
US20050246358A1 (en) * | 2004-04-29 | 2005-11-03 | Gross John N | System & method of identifying and predicting innovation dissemination |
US20050246391A1 (en) * | 2004-04-29 | 2005-11-03 | Gross John N | System & method for monitoring web pages |
US20060010029A1 (en) * | 2004-04-29 | 2006-01-12 | Gross John N | System & method for online advertising |
US20050256848A1 (en) * | 2004-05-13 | 2005-11-17 | International Business Machines Corporation | System and method for user rank search |
US7260573B1 (en) * | 2004-05-17 | 2007-08-21 | Google Inc. | Personalizing anchor text scores in a search engine |
US8019875B1 (en) | 2004-06-04 | 2011-09-13 | Google Inc. | Systems and methods for indicating a user state in a social network |
JP4254623B2 (ja) * | 2004-06-09 | 2009-04-15 | 日本電気株式会社 | トピック分析方法及びその装置並びにプログラム |
US7716225B1 (en) * | 2004-06-17 | 2010-05-11 | Google Inc. | Ranking documents based on user behavior and/or feature data |
US7565445B2 (en) | 2004-06-18 | 2009-07-21 | Fortinet, Inc. | Systems and methods for categorizing network traffic content |
US8832132B1 (en) | 2004-06-22 | 2014-09-09 | Google Inc. | Personalizing search queries based on user membership in social network communities |
US8621215B1 (en) | 2004-06-30 | 2013-12-31 | Google Inc. | Methods and systems for creating monetary accounts for members in a social network |
US7783639B1 (en) | 2004-06-30 | 2010-08-24 | Google Inc. | Determining quality of linked documents |
US8620915B1 (en) | 2007-03-13 | 2013-12-31 | Google Inc. | Systems and methods for promoting personalized search results based on personal information |
US8078607B2 (en) * | 2006-03-30 | 2011-12-13 | Google Inc. | Generating website profiles based on queries from webistes and user activities on the search results |
US20060020583A1 (en) * | 2004-07-23 | 2006-01-26 | Baranov Alexey V | System and method for searching and retrieving documents by their descriptions |
US7567959B2 (en) | 2004-07-26 | 2009-07-28 | Google Inc. | Multiple index based information retrieval system |
US7580921B2 (en) * | 2004-07-26 | 2009-08-25 | Google Inc. | Phrase identification in an information retrieval system |
US7702618B1 (en) | 2004-07-26 | 2010-04-20 | Google Inc. | Information retrieval system for archiving multiple document versions |
US7711679B2 (en) | 2004-07-26 | 2010-05-04 | Google Inc. | Phrase-based detection of duplicate documents in an information retrieval system |
US8015019B1 (en) | 2004-08-03 | 2011-09-06 | Google Inc. | Methods and systems for providing a document |
US7752200B2 (en) | 2004-08-09 | 2010-07-06 | Amazon Technologies, Inc. | Method and system for identifying keywords for use in placing keyword-targeted advertisements |
JP2006065395A (ja) * | 2004-08-24 | 2006-03-09 | Fujitsu Ltd | ハイパーリンク生成装置、ハイパーリンク生成方法及びハイパーリンク生成プログラム |
US7987172B1 (en) | 2004-08-30 | 2011-07-26 | Google Inc. | Minimizing visibility of stale content in web searching including revising web crawl intervals of documents |
US7606793B2 (en) * | 2004-09-27 | 2009-10-20 | Microsoft Corporation | System and method for scoping searches using index keys |
US8065296B1 (en) * | 2004-09-29 | 2011-11-22 | Google Inc. | Systems and methods for determining a quality of provided items |
US20060069675A1 (en) * | 2004-09-30 | 2006-03-30 | Ogilvie John W | Search tools and techniques |
US7827181B2 (en) * | 2004-09-30 | 2010-11-02 | Microsoft Corporation | Click distance determination |
US7761448B2 (en) | 2004-09-30 | 2010-07-20 | Microsoft Corporation | System and method for ranking search results using click distance |
US7739277B2 (en) * | 2004-09-30 | 2010-06-15 | Microsoft Corporation | System and method for incorporating anchor text into ranking search results |
US8056128B1 (en) | 2004-09-30 | 2011-11-08 | Google Inc. | Systems and methods for detecting potential communications fraud |
US11283885B2 (en) | 2004-10-19 | 2022-03-22 | Verizon Patent And Licensing Inc. | System and method for location based matching and promotion |
JP2006146873A (ja) * | 2004-10-22 | 2006-06-08 | Canon Inc | データ検索方法、装置及びプログラム |
US20060095841A1 (en) * | 2004-10-28 | 2006-05-04 | Microsoft Corporation | Methods and apparatus for document management |
US7533092B2 (en) * | 2004-10-28 | 2009-05-12 | Yahoo! Inc. | Link-based spam detection |
US8117339B2 (en) * | 2004-10-29 | 2012-02-14 | Go Daddy Operating Company, LLC | Tracking domain name related reputation |
US20060095459A1 (en) * | 2004-10-29 | 2006-05-04 | Warren Adelman | Publishing domain name related reputation in whois records |
US7797413B2 (en) * | 2004-10-29 | 2010-09-14 | The Go Daddy Group, Inc. | Digital identity registration |
US20060200487A1 (en) * | 2004-10-29 | 2006-09-07 | The Go Daddy Group, Inc. | Domain name related reputation and secure certificates |
US20060095404A1 (en) * | 2004-10-29 | 2006-05-04 | The Go Daddy Group, Inc | Presenting search engine results based on domain name related reputation |
US20080022013A1 (en) * | 2004-10-29 | 2008-01-24 | The Go Daddy Group, Inc. | Publishing domain name related reputation in whois records |
US9015263B2 (en) | 2004-10-29 | 2015-04-21 | Go Daddy Operating Company, LLC | Domain name searching with reputation rating |
US8904040B2 (en) * | 2004-10-29 | 2014-12-02 | Go Daddy Operating Company, LLC | Digital identity validation |
US20080028443A1 (en) * | 2004-10-29 | 2008-01-31 | The Go Daddy Group, Inc. | Domain name related reputation and secure certificates |
US20080028100A1 (en) * | 2004-10-29 | 2008-01-31 | The Go Daddy Group, Inc. | Tracking domain name related reputation |
US7970858B2 (en) * | 2004-10-29 | 2011-06-28 | The Go Daddy Group, Inc. | Presenting search engine results based on domain name related reputation |
US7716206B2 (en) * | 2004-11-01 | 2010-05-11 | At&T Intellectual Property I, L.P. | Communication networks and methods and computer program products for performing searches thereon while maintaining user privacy |
US7370381B2 (en) | 2004-11-22 | 2008-05-13 | Truveo, Inc. | Method and apparatus for a ranking engine |
AU2005309617B2 (en) | 2004-11-22 | 2009-03-26 | Facebook, Inc. | Method and apparatus for an application crawler |
US20060112089A1 (en) * | 2004-11-22 | 2006-05-25 | International Business Machines Corporation | Methods and apparatus for assessing web page decay |
US7584194B2 (en) * | 2004-11-22 | 2009-09-01 | Truveo, Inc. | Method and apparatus for an application crawler |
US8874570B1 (en) | 2004-11-30 | 2014-10-28 | Google Inc. | Search boost vector based on co-visitation information |
US7801723B2 (en) * | 2004-11-30 | 2010-09-21 | Palo Alto Research Center Incorporated | Systems and methods for user-interest sensitive condensation |
US7827029B2 (en) * | 2004-11-30 | 2010-11-02 | Palo Alto Research Center Incorporated | Systems and methods for user-interest sensitive note-taking |
US20060122957A1 (en) * | 2004-12-03 | 2006-06-08 | Johnny Chen | Method and system to detect e-mail spam using concept categorization of linked content |
US7716198B2 (en) * | 2004-12-21 | 2010-05-11 | Microsoft Corporation | Ranking search results using feature extraction |
US7401077B2 (en) * | 2004-12-21 | 2008-07-15 | Palo Alto Research Center Incorporated | Systems and methods for using and constructing user-interest sensitive indicators of search results |
JP4344339B2 (ja) * | 2004-12-24 | 2009-10-14 | 日本電信電話株式会社 | 情報評価装置、コンテンツ検索装置、情報評価方法、コンテンツ検索方法、それらのプログラム及び記録媒体 |
US20060149710A1 (en) * | 2004-12-30 | 2006-07-06 | Ross Koningstein | Associating features with entities, such as categories of web page documents, and/or weighting such features |
US8538970B1 (en) | 2004-12-30 | 2013-09-17 | Google Inc. | Personalizing search results |
US10402457B1 (en) | 2004-12-31 | 2019-09-03 | Google Llc | Methods and systems for correlating connections between users and links between articles |
US8060405B1 (en) | 2004-12-31 | 2011-11-15 | Google Inc. | Methods and systems for correlating connections between users and links between articles |
US8230422B2 (en) * | 2005-01-13 | 2012-07-24 | International Business Machines Corporation | Assist thread for injecting cache memory in a microprocessor |
US20060161520A1 (en) * | 2005-01-14 | 2006-07-20 | Microsoft Corporation | System and method for generating alternative search terms |
US20050125451A1 (en) * | 2005-02-10 | 2005-06-09 | The Go Daddy Group, Inc. | Search engine and domain name search integration |
US7657520B2 (en) * | 2005-03-03 | 2010-02-02 | Google, Inc. | Providing history and transaction volume information of a content source to users |
US7792833B2 (en) * | 2005-03-03 | 2010-09-07 | Microsoft Corporation | Ranking search results using language types |
US20060200460A1 (en) * | 2005-03-03 | 2006-09-07 | Microsoft Corporation | System and method for ranking search results using file types |
US8538810B2 (en) * | 2005-03-29 | 2013-09-17 | Google Inc. | Methods and systems for member-created advertisement in a member network |
US8412780B2 (en) | 2005-03-30 | 2013-04-02 | Google Inc. | Methods and systems for providing current email addresses and contact information for members within a social network |
US20060224583A1 (en) * | 2005-03-31 | 2006-10-05 | Google, Inc. | Systems and methods for analyzing a user's web history |
US20060224608A1 (en) * | 2005-03-31 | 2006-10-05 | Google, Inc. | Systems and methods for combining sets of favorites |
US9256685B2 (en) * | 2005-03-31 | 2016-02-09 | Google Inc. | Systems and methods for modifying search results based on a user's history |
US20060235842A1 (en) * | 2005-04-14 | 2006-10-19 | International Business Machines Corporation | Web page ranking for page query across public and private |
MX2007013020A (es) * | 2005-04-18 | 2008-03-18 | Collage Analytics Llc | Sistema y metodo para rastrear y fechar contenido de manera eficiente en espacios de documentos dinamicos muy grandes. |
US8732175B2 (en) | 2005-04-21 | 2014-05-20 | Yahoo! Inc. | Interestingness ranking of media objects |
US7403767B2 (en) * | 2005-04-29 | 2008-07-22 | Siemens Aktiengesellschaft | Cellular telephone network with record keeping for missed calls |
US7660792B2 (en) * | 2005-04-29 | 2010-02-09 | Microsoft Corporation | System and method for spam identification |
US8438499B2 (en) | 2005-05-03 | 2013-05-07 | Mcafee, Inc. | Indicating website reputations during user interactions |
US8566726B2 (en) | 2005-05-03 | 2013-10-22 | Mcafee, Inc. | Indicating website reputations based on website handling of personal information |
US7822620B2 (en) | 2005-05-03 | 2010-10-26 | Mcafee, Inc. | Determining website reputations using automatic testing |
US7765481B2 (en) | 2005-05-03 | 2010-07-27 | Mcafee, Inc. | Indicating website reputations during an electronic commerce transaction |
US7562304B2 (en) | 2005-05-03 | 2009-07-14 | Mcafee, Inc. | Indicating website reputations during website manipulation of user information |
US9384345B2 (en) | 2005-05-03 | 2016-07-05 | Mcafee, Inc. | Providing alternative web content based on website reputation assessment |
US20060253423A1 (en) * | 2005-05-07 | 2006-11-09 | Mclane Mark | Information retrieval system and method |
US7630976B2 (en) * | 2005-05-10 | 2009-12-08 | Microsoft Corporation | Method and system for adapting search results to personal information needs |
US7962462B1 (en) * | 2005-05-31 | 2011-06-14 | Google Inc. | Deriving and using document and site quality signals from search query streams |
JP2006350954A (ja) * | 2005-06-20 | 2006-12-28 | Chugoku Electric Power Co Inc:The | 電柱管理システム |
US7788132B2 (en) * | 2005-06-29 | 2010-08-31 | Google, Inc. | Reviewing the suitability of Websites for participation in an advertising network |
US8244722B1 (en) * | 2005-06-30 | 2012-08-14 | Google Inc. | Ranking documents |
US8195654B1 (en) | 2005-07-13 | 2012-06-05 | Google Inc. | Prediction of human ratings or rankings of information retrieval quality |
US20070022385A1 (en) * | 2005-07-20 | 2007-01-25 | Mikhail Denissov | Software module, method and system for managing information items by bookmarking information items through activation of said items |
US7599917B2 (en) * | 2005-08-15 | 2009-10-06 | Microsoft Corporation | Ranking search results using biased click distance |
US7860895B1 (en) * | 2005-08-23 | 2010-12-28 | Amazon Technologies, Inc. | Method and system for determining interest spaces among online content sources |
KR100644159B1 (ko) | 2005-09-05 | 2006-11-10 | 엔에이치엔(주) | 검색 컨트롤러 제어 방법 및 그 장치 |
US8099674B2 (en) | 2005-09-09 | 2012-01-17 | Tableau Software Llc | Computer systems and methods for automatically viewing multidimensional databases |
US8244720B2 (en) * | 2005-09-13 | 2012-08-14 | Google Inc. | Ranking blog documents |
US9703892B2 (en) | 2005-09-14 | 2017-07-11 | Millennial Media Llc | Predictive text completion for a mobile communication facility |
US8666376B2 (en) * | 2005-09-14 | 2014-03-04 | Millennial Media | Location based mobile shopping affinity program |
US20080214152A1 (en) * | 2005-09-14 | 2008-09-04 | Jorey Ramer | Methods and systems of mobile dynamic content presentation |
US8364521B2 (en) * | 2005-09-14 | 2013-01-29 | Jumptap, Inc. | Rendering targeted advertisement on mobile communication facilities |
US20070100652A1 (en) * | 2005-11-01 | 2007-05-03 | Jorey Ramer | Mobile pay per call |
US20070100653A1 (en) * | 2005-11-01 | 2007-05-03 | Jorey Ramer | Mobile website analyzer |
US8156128B2 (en) | 2005-09-14 | 2012-04-10 | Jumptap, Inc. | Contextual mobile content placement on a mobile communication facility |
US9058406B2 (en) | 2005-09-14 | 2015-06-16 | Millennial Media, Inc. | Management of multiple advertising inventories using a monetization platform |
US20070061242A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Implicit searching for mobile content |
US8819659B2 (en) | 2005-09-14 | 2014-08-26 | Millennial Media, Inc. | Mobile search service instant activation |
US8290810B2 (en) * | 2005-09-14 | 2012-10-16 | Jumptap, Inc. | Realtime surveying within mobile sponsored content |
US8812526B2 (en) | 2005-09-14 | 2014-08-19 | Millennial Media, Inc. | Mobile content cross-inventory yield optimization |
US8364540B2 (en) | 2005-09-14 | 2013-01-29 | Jumptap, Inc. | Contextual targeting of content using a monetization platform |
US20070100651A1 (en) * | 2005-11-01 | 2007-05-03 | Jorey Ramer | Mobile payment facilitation |
US20070060109A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Managing sponsored content based on user characteristics |
US20110313853A1 (en) | 2005-09-14 | 2011-12-22 | Jorey Ramer | System for targeting advertising content to a plurality of mobile communication facilities |
US9201979B2 (en) | 2005-09-14 | 2015-12-01 | Millennial Media, Inc. | Syndication of a behavioral profile associated with an availability condition using a monetization platform |
US20070288427A1 (en) * | 2005-09-14 | 2007-12-13 | Jorey Ramer | Mobile pay-per-call campaign creation |
US10592930B2 (en) | 2005-09-14 | 2020-03-17 | Millenial Media, LLC | Syndication of a behavioral profile using a monetization platform |
US20070168354A1 (en) * | 2005-11-01 | 2007-07-19 | Jorey Ramer | Combined algorithmic and editorial-reviewed mobile content search results |
US10038756B2 (en) | 2005-09-14 | 2018-07-31 | Millenial Media LLC | Managing sponsored content based on device characteristics |
US8027879B2 (en) * | 2005-11-05 | 2011-09-27 | Jumptap, Inc. | Exclusivity bidding for mobile sponsored content |
US8660891B2 (en) | 2005-11-01 | 2014-02-25 | Millennial Media | Interactive mobile advertisement banners |
US20070073718A1 (en) * | 2005-09-14 | 2007-03-29 | Jorey Ramer | Mobile search service instant activation |
US7860871B2 (en) | 2005-09-14 | 2010-12-28 | Jumptap, Inc. | User history influenced search results |
US20070100805A1 (en) * | 2005-09-14 | 2007-05-03 | Jorey Ramer | Mobile content cross-inventory yield optimization |
US8195133B2 (en) | 2005-09-14 | 2012-06-05 | Jumptap, Inc. | Mobile dynamic advertisement creation and placement |
US20080214155A1 (en) * | 2005-11-01 | 2008-09-04 | Jorey Ramer | Integrating subscription content into mobile search results |
US8688671B2 (en) | 2005-09-14 | 2014-04-01 | Millennial Media | Managing sponsored content based on geographic region |
US8103545B2 (en) | 2005-09-14 | 2012-01-24 | Jumptap, Inc. | Managing payment for sponsored content presented to mobile communication facilities |
US20080214151A1 (en) * | 2005-09-14 | 2008-09-04 | Jorey Ramer | Methods and systems for mobile coupon placement |
US20070073719A1 (en) * | 2005-09-14 | 2007-03-29 | Jorey Ramer | Physical navigation of a mobile search application |
US8311888B2 (en) | 2005-09-14 | 2012-11-13 | Jumptap, Inc. | Revenue models associated with syndication of a behavioral profile using a monetization platform |
US20070100806A1 (en) * | 2005-11-01 | 2007-05-03 | Jorey Ramer | Client libraries for mobile content |
US7676394B2 (en) * | 2005-09-14 | 2010-03-09 | Jumptap, Inc. | Dynamic bidding and expected value |
US20080270220A1 (en) * | 2005-11-05 | 2008-10-30 | Jorey Ramer | Embedding a nonsponsored mobile content within a sponsored mobile content |
US20070100650A1 (en) * | 2005-09-14 | 2007-05-03 | Jorey Ramer | Action functionality for mobile content search results |
US8131271B2 (en) | 2005-11-05 | 2012-03-06 | Jumptap, Inc. | Categorization of a mobile user profile based on browse behavior |
US20070061245A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Location based presentation of mobile content |
US8238888B2 (en) | 2006-09-13 | 2012-08-07 | Jumptap, Inc. | Methods and systems for mobile coupon placement |
US8209344B2 (en) | 2005-09-14 | 2012-06-26 | Jumptap, Inc. | Embedding sponsored content in mobile applications |
US20080214204A1 (en) * | 2005-11-01 | 2008-09-04 | Jorey Ramer | Similarity based location mapping of mobile comm facility users |
US8229914B2 (en) | 2005-09-14 | 2012-07-24 | Jumptap, Inc. | Mobile content spidering and compatibility determination |
US20080215623A1 (en) * | 2005-09-14 | 2008-09-04 | Jorey Ramer | Mobile communication facility usage and social network creation |
US20070073717A1 (en) * | 2005-09-14 | 2007-03-29 | Jorey Ramer | Mobile comparison shopping |
US9471925B2 (en) * | 2005-09-14 | 2016-10-18 | Millennial Media Llc | Increasing mobile interactivity |
US7702318B2 (en) | 2005-09-14 | 2010-04-20 | Jumptap, Inc. | Presentation of sponsored content based on mobile transaction event |
US20070060173A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Managing sponsored content based on transaction history |
US8302030B2 (en) | 2005-09-14 | 2012-10-30 | Jumptap, Inc. | Management of multiple advertising inventories using a monetization platform |
US7603360B2 (en) * | 2005-09-14 | 2009-10-13 | Jumptap, Inc. | Location influenced search results |
US8503995B2 (en) | 2005-09-14 | 2013-08-06 | Jumptap, Inc. | Mobile dynamic advertisement creation and placement |
US20070192318A1 (en) * | 2005-09-14 | 2007-08-16 | Jorey Ramer | Creation of a mobile search suggestion dictionary |
US8832100B2 (en) * | 2005-09-14 | 2014-09-09 | Millennial Media, Inc. | User transaction history influenced search results |
US7752209B2 (en) | 2005-09-14 | 2010-07-06 | Jumptap, Inc. | Presenting sponsored content on a mobile communication facility |
US10911894B2 (en) | 2005-09-14 | 2021-02-02 | Verizon Media Inc. | Use of dynamic content generation parameters based on previous performance of those parameters |
US7912458B2 (en) | 2005-09-14 | 2011-03-22 | Jumptap, Inc. | Interaction analysis and prioritization of mobile content |
US20070061246A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Mobile campaign creation |
US8805339B2 (en) | 2005-09-14 | 2014-08-12 | Millennial Media, Inc. | Categorization of a mobile user profile based on browse and viewing behavior |
US20080214154A1 (en) * | 2005-11-01 | 2008-09-04 | Jorey Ramer | Associating mobile and non mobile web content |
US20070061247A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Expected value and prioritization of mobile content |
US9076175B2 (en) | 2005-09-14 | 2015-07-07 | Millennial Media, Inc. | Mobile comparison shopping |
US7577665B2 (en) | 2005-09-14 | 2009-08-18 | Jumptap, Inc. | User characteristic influenced search results |
US7769764B2 (en) | 2005-09-14 | 2010-08-03 | Jumptap, Inc. | Mobile advertisement syndication |
US20090029687A1 (en) * | 2005-09-14 | 2009-01-29 | Jorey Ramer | Combining mobile and transcoded content in a mobile search result |
US20070060114A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Predictive text completion for a mobile communication facility |
US8463249B2 (en) | 2005-09-14 | 2013-06-11 | Jumptap, Inc. | System for targeting advertising content to a plurality of mobile communication facilities |
US8989718B2 (en) | 2005-09-14 | 2015-03-24 | Millennial Media, Inc. | Idle screen advertising |
US20080214153A1 (en) * | 2005-09-14 | 2008-09-04 | Jorey Ramer | Mobile User Profile Creation based on User Browse Behaviors |
US20070073722A1 (en) * | 2005-09-14 | 2007-03-29 | Jorey Ramer | Calculation and presentation of mobile content expected value |
US20070239724A1 (en) * | 2005-09-14 | 2007-10-11 | Jorey Ramer | Mobile search services related to direct identifiers |
US7660581B2 (en) * | 2005-09-14 | 2010-02-09 | Jumptap, Inc. | Managing sponsored content based on usage history |
US8615719B2 (en) | 2005-09-14 | 2013-12-24 | Jumptap, Inc. | Managing sponsored content for delivery to mobile communication facilities |
US7925786B2 (en) * | 2005-09-16 | 2011-04-12 | Microsoft Corp. | Hosting of network-based services |
US7987251B2 (en) * | 2005-09-16 | 2011-07-26 | Microsoft Corporation | Validation of domain name control |
US7499919B2 (en) * | 2005-09-21 | 2009-03-03 | Microsoft Corporation | Ranking functions using document usage statistics |
US20070078939A1 (en) * | 2005-09-26 | 2007-04-05 | Technorati, Inc. | Method and apparatus for identifying and classifying network documents as spam |
JP4241705B2 (ja) * | 2005-09-30 | 2009-03-18 | ブラザー工業株式会社 | 情報管理装置、及び、プログラム |
US7933897B2 (en) * | 2005-10-12 | 2011-04-26 | Google Inc. | Entity display priority in a distributed geographic information system |
US8095419B1 (en) * | 2005-10-17 | 2012-01-10 | Yahoo! Inc. | Search score for the determination of search quality |
US7613690B2 (en) * | 2005-10-21 | 2009-11-03 | Aol Llc | Real time query trends with multi-document summarization |
US8266162B2 (en) | 2005-10-31 | 2012-09-11 | Lycos, Inc. | Automatic identification of related search keywords |
US7783632B2 (en) * | 2005-11-03 | 2010-08-24 | Microsoft Corporation | Using popularity data for ranking |
US8175585B2 (en) * | 2005-11-05 | 2012-05-08 | Jumptap, Inc. | System for targeting advertising content to a plurality of mobile communication facilities |
US10324899B2 (en) * | 2005-11-07 | 2019-06-18 | Nokia Technologies Oy | Methods for characterizing content item groups |
US20100285818A1 (en) * | 2009-05-08 | 2010-11-11 | Crawford C S Lee | Location based service for directing ads to subscribers |
US8571999B2 (en) | 2005-11-14 | 2013-10-29 | C. S. Lee Crawford | Method of conducting operations for a social network application including activity list generation |
US8645376B2 (en) | 2008-05-02 | 2014-02-04 | Salesforce.Com, Inc. | Method and system for managing recent data in a mobile device linked to an on-demand service |
US9135304B2 (en) * | 2005-12-02 | 2015-09-15 | Salesforce.Com, Inc. | Methods and systems for optimizing text searches over structured data in a multi-tenant environment |
US8095565B2 (en) * | 2005-12-05 | 2012-01-10 | Microsoft Corporation | Metadata driven user interface |
IL172551A0 (en) * | 2005-12-13 | 2006-04-10 | Grois Dan | Method for assigning one or more categorized scores to each document over a data network |
US7971137B2 (en) * | 2005-12-14 | 2011-06-28 | Google Inc. | Detecting and rejecting annoying documents |
US20080010252A1 (en) * | 2006-01-09 | 2008-01-10 | Google, Inc. | Bookmarks and ranking |
US8266130B2 (en) | 2006-01-23 | 2012-09-11 | Chacha Search, Inc. | Search tool providing optional use of human search guides |
US8117196B2 (en) * | 2006-01-23 | 2012-02-14 | Chacha Search, Inc. | Search tool providing optional use of human search guides |
US20070174258A1 (en) * | 2006-01-23 | 2007-07-26 | Jones Scott A | Targeted mobile device advertisements |
US7962466B2 (en) * | 2006-01-23 | 2011-06-14 | Chacha Search, Inc | Automated tool for human assisted mining and capturing of precise results |
US8065286B2 (en) * | 2006-01-23 | 2011-11-22 | Chacha Search, Inc. | Scalable search system using human searchers |
US7814099B2 (en) * | 2006-01-31 | 2010-10-12 | Louis S. Wang | Method for ranking and sorting electronic documents in a search result list based on relevance |
US7584183B2 (en) * | 2006-02-01 | 2009-09-01 | Yahoo! Inc. | Method for node classification and scoring by combining parallel iterative scoring calculation |
US8429177B2 (en) * | 2006-02-08 | 2013-04-23 | Yahoo! Inc. | Using exceptional changes in webgraph snapshots over time for internet entity marking |
US7844603B2 (en) * | 2006-02-17 | 2010-11-30 | Google Inc. | Sharing user distributed search results |
KR100804671B1 (ko) * | 2006-02-27 | 2008-02-20 | 엔에이치엔(주) | 응답 지연 제거를 위한 로컬 단말기 검색 시스템 및 방법 |
US7493403B2 (en) * | 2006-03-13 | 2009-02-17 | Markmonitor Inc. | Domain name ownership validation |
US8117195B1 (en) | 2006-03-22 | 2012-02-14 | Google Inc. | Providing blog posts relevant to search results |
US9135238B2 (en) * | 2006-03-31 | 2015-09-15 | Google Inc. | Disambiguation of named entities |
US7933890B2 (en) | 2006-03-31 | 2011-04-26 | Google Inc. | Propagating useful information among related web pages, such as web pages of a website |
US7647314B2 (en) * | 2006-04-28 | 2010-01-12 | Yahoo! Inc. | System and method for indexing web content using click-through features |
US7624104B2 (en) * | 2006-06-22 | 2009-11-24 | Yahoo! Inc. | User-sensitive pagerank |
CN100524307C (zh) * | 2006-06-27 | 2009-08-05 | 国际商业机器公司 | 一种建立文档间关联关系的方法和装置 |
US7716236B2 (en) * | 2006-07-06 | 2010-05-11 | Aol Inc. | Temporal search query personalization |
US7873641B2 (en) * | 2006-07-14 | 2011-01-18 | Bea Systems, Inc. | Using tags in an enterprise search system |
US20080016052A1 (en) * | 2006-07-14 | 2008-01-17 | Bea Systems, Inc. | Using Connections Between Users and Documents to Rank Documents in an Enterprise Search System |
US20080016072A1 (en) * | 2006-07-14 | 2008-01-17 | Bea Systems, Inc. | Enterprise-Based Tag System |
US20080016061A1 (en) * | 2006-07-14 | 2008-01-17 | Bea Systems, Inc. | Using a Core Data Structure to Calculate Document Ranks |
WO2008010847A2 (en) * | 2006-07-14 | 2008-01-24 | Bea Systems, Inc. | Improved enterprise search system |
US20080016071A1 (en) * | 2006-07-14 | 2008-01-17 | Bea Systems, Inc. | Using Connections Between Users, Tags and Documents to Rank Documents in an Enterprise Search System |
US20080016053A1 (en) * | 2006-07-14 | 2008-01-17 | Bea Systems, Inc. | Administration Console to Select Rank Factors |
WO2008010729A1 (en) * | 2006-07-17 | 2008-01-24 | Eurekster, Inc | A method of determining reputation for community search engines |
US8965874B1 (en) * | 2006-08-04 | 2015-02-24 | Google Inc. | Dynamic aggregation of users |
US8606834B2 (en) * | 2006-08-16 | 2013-12-10 | Apple Inc. | Managing supplied data |
US7831472B2 (en) | 2006-08-22 | 2010-11-09 | Yufik Yan M | Methods and system for search engine revenue maximization in internet advertising |
US20080126331A1 (en) * | 2006-08-25 | 2008-05-29 | Xerox Corporation | System and method for ranking reference documents |
US20080071797A1 (en) * | 2006-09-15 | 2008-03-20 | Thornton Nathaniel L | System and method to calculate average link growth on search engines for a keyword |
US7577643B2 (en) * | 2006-09-29 | 2009-08-18 | Microsoft Corporation | Key phrase extraction from query logs |
US9037581B1 (en) * | 2006-09-29 | 2015-05-19 | Google Inc. | Personalized search result ranking |
US8548991B1 (en) * | 2006-09-29 | 2013-10-01 | Google Inc. | Personalized browsing activity displays |
US9740778B2 (en) * | 2006-10-10 | 2017-08-22 | Microsoft Technology Licensing, Llc | Ranking domains using domain maturity |
US8745183B2 (en) * | 2006-10-26 | 2014-06-03 | Yahoo! Inc. | System and method for adaptively refreshing a web page |
WO2008052205A2 (en) * | 2006-10-27 | 2008-05-02 | Jumptap, Inc. | Combined algorithmic and editorial-reviewed mobile content search results |
US7937403B2 (en) * | 2006-10-30 | 2011-05-03 | Yahoo! Inc. | Time-based analysis of related keyword searching |
US9110975B1 (en) * | 2006-11-02 | 2015-08-18 | Google Inc. | Search result inputs using variant generalized queries |
US8661029B1 (en) | 2006-11-02 | 2014-02-25 | Google Inc. | Modifying search result ranking based on implicit user feedback |
US20080126430A1 (en) * | 2006-11-28 | 2008-05-29 | Garrett Andrew J | Intermediary document for critical change control |
US8577866B1 (en) * | 2006-12-07 | 2013-11-05 | Googe Inc. | Classifying content |
US8983970B1 (en) | 2006-12-07 | 2015-03-17 | Google Inc. | Ranking content using content and content authors |
JP5137397B2 (ja) * | 2006-12-28 | 2013-02-06 | キヤノン株式会社 | データ管理装置、データ処理方法、及びコンピュータプログラム |
US8280871B2 (en) * | 2006-12-29 | 2012-10-02 | Yahoo! Inc. | Identifying offensive content using user click data |
US8046358B2 (en) * | 2007-02-16 | 2011-10-25 | Ge Healthcare | Context-based information retrieval |
US8938463B1 (en) | 2007-03-12 | 2015-01-20 | Google Inc. | Modifying search result ranking based on implicit user feedback and a model of presentation bias |
US8694374B1 (en) | 2007-03-14 | 2014-04-08 | Google Inc. | Detecting click spam |
JP4861865B2 (ja) * | 2007-03-15 | 2012-01-25 | 富士通株式会社 | アクセス結果フィードバックプログラム、記録媒体、アクセス結果フィードバック方法、アクセス結果フィードバック装置、および端末装置 |
JP4781466B2 (ja) * | 2007-03-16 | 2011-09-28 | 富士通株式会社 | 文書重要度算出プログラム |
JP4894580B2 (ja) * | 2007-03-20 | 2012-03-14 | 日本電気株式会社 | 旬度解析システム、旬度解析方法、及び旬度解析プログラム |
US8176055B1 (en) * | 2007-03-27 | 2012-05-08 | Google Inc. | Content entity management |
US8788320B1 (en) | 2007-03-28 | 2014-07-22 | Amazon Technologies, Inc. | Release advertisement system |
US7693813B1 (en) | 2007-03-30 | 2010-04-06 | Google Inc. | Index server architecture using tiered and sharded phrase posting lists |
US8166045B1 (en) | 2007-03-30 | 2012-04-24 | Google Inc. | Phrase extraction using subphrase scoring |
US7702614B1 (en) | 2007-03-30 | 2010-04-20 | Google Inc. | Index updating using segment swapping |
US20080244428A1 (en) * | 2007-03-30 | 2008-10-02 | Yahoo! Inc. | Visually Emphasizing Query Results Based on Relevance Feedback |
US7925655B1 (en) | 2007-03-30 | 2011-04-12 | Google Inc. | Query scheduling using hierarchical tiers of index servers |
US8086594B1 (en) | 2007-03-30 | 2011-12-27 | Google Inc. | Bifurcated document relevance scoring |
US8166021B1 (en) | 2007-03-30 | 2012-04-24 | Google Inc. | Query phrasification |
US7672937B2 (en) * | 2007-04-11 | 2010-03-02 | Yahoo, Inc. | Temporal targeting of advertisements |
US7676520B2 (en) * | 2007-04-12 | 2010-03-09 | Microsoft Corporation | Calculating importance of documents factoring historical importance |
IL182518A0 (en) * | 2007-04-12 | 2007-09-20 | Grois Dan | Pay per relevance (ppr) advertising method and system |
US9092510B1 (en) | 2007-04-30 | 2015-07-28 | Google Inc. | Modifying search result ranking based on a temporal element of user feedback |
US8706696B2 (en) | 2007-05-04 | 2014-04-22 | Salesforce.Com, Inc. | Method and system for on-demand communities |
US20080275846A1 (en) * | 2007-05-04 | 2008-11-06 | Sony Ericsson Mobile Communications Ab | Filtering search results using contact lists |
US7788254B2 (en) * | 2007-05-04 | 2010-08-31 | Microsoft Corporation | Web page analysis using multiple graphs |
US20080275877A1 (en) * | 2007-05-04 | 2008-11-06 | International Business Machines Corporation | Method and system for variable keyword processing based on content dates on a web page |
US20090248623A1 (en) * | 2007-05-09 | 2009-10-01 | The Go Daddy Group, Inc. | Accessing digital identity related reputation data |
US8359309B1 (en) | 2007-05-23 | 2013-01-22 | Google Inc. | Modifying search result ranking based on corpus search statistics |
US8046372B1 (en) | 2007-05-25 | 2011-10-25 | Amazon Technologies, Inc. | Duplicate entry detection system and method |
US7814107B1 (en) | 2007-05-25 | 2010-10-12 | Amazon Technologies, Inc. | Generating similarity scores for matching non-identical data strings |
US7908279B1 (en) | 2007-05-25 | 2011-03-15 | Amazon Technologies, Inc. | Filtering invalid tokens from a document using high IDF token filtering |
US7644075B2 (en) * | 2007-06-01 | 2010-01-05 | Microsoft Corporation | Keyword usage score based on frequency impulse and frequency weight |
US8244737B2 (en) * | 2007-06-18 | 2012-08-14 | Microsoft Corporation | Ranking documents based on a series of document graphs |
US8290986B2 (en) * | 2007-06-27 | 2012-10-16 | Yahoo! Inc. | Determining quality measures for web objects based on searcher behavior |
US20090006358A1 (en) * | 2007-06-27 | 2009-01-01 | Microsoft Corporation | Search results |
US20090006341A1 (en) * | 2007-06-28 | 2009-01-01 | Bruce Chapman | Method of website ranking promotion using creation of mass blog posting links |
US20090013068A1 (en) * | 2007-07-02 | 2009-01-08 | Eaglestone Robert J | Systems and processes for evaluating webpages |
US20090013033A1 (en) * | 2007-07-06 | 2009-01-08 | Yahoo! Inc. | Identifying excessively reciprocal links among web entities |
US7991790B2 (en) * | 2007-07-20 | 2011-08-02 | Salesforce.Com, Inc. | System and method for storing documents accessed by multiple users in an on-demand service |
US7966341B2 (en) * | 2007-08-06 | 2011-06-21 | Yahoo! Inc. | Estimating the date relevance of a query from query logs |
CN101843041B (zh) * | 2007-08-17 | 2013-01-02 | 谷歌公司 | 在线社交网络中的多社区内容共享 |
CN101836392A (zh) * | 2007-08-17 | 2010-09-15 | 谷歌公司 | 动态命名在线社交网络中的社区 |
US8572094B2 (en) * | 2007-08-17 | 2013-10-29 | Google Inc. | Ranking social network objects |
US8694511B1 (en) | 2007-08-20 | 2014-04-08 | Google Inc. | Modifying search result ranking based on populations |
EP2193457A1 (de) * | 2007-09-03 | 2010-06-09 | IQser IP AG | Erfassung von zusammenhängen zwischen informationen repräsentierenden daten |
US8117223B2 (en) * | 2007-09-07 | 2012-02-14 | Google Inc. | Integrating external related phrase information into a phrase-based indexing information retrieval system |
CN100514337C (zh) * | 2007-09-10 | 2009-07-15 | 腾讯科技(深圳)有限公司 | 关键词的联想信息生成系统和生成方法 |
JP2009070156A (ja) * | 2007-09-13 | 2009-04-02 | Ntt Docomo Inc | 情報検索システム及び情報検索方法 |
KR20090030966A (ko) * | 2007-09-21 | 2009-03-25 | 삼성전자주식회사 | 휴대용 단말기에서 메뉴 리스트 순위 구성 방법 및 장치 |
US20090089311A1 (en) * | 2007-09-28 | 2009-04-02 | Yahoo! Inc. | System and method for inclusion of history in a search results page |
US8909655B1 (en) | 2007-10-11 | 2014-12-09 | Google Inc. | Time based ranking |
US9348912B2 (en) * | 2007-10-18 | 2016-05-24 | Microsoft Technology Licensing, Llc | Document length as a static relevance feature for ranking search results |
US20090106221A1 (en) * | 2007-10-18 | 2009-04-23 | Microsoft Corporation | Ranking and Providing Search Results Based In Part On A Number Of Click-Through Features |
US7840569B2 (en) * | 2007-10-18 | 2010-11-23 | Microsoft Corporation | Enterprise relevancy ranking using a neural network |
US8078613B2 (en) * | 2007-11-28 | 2011-12-13 | Red Hat, Inc. | Method for removing network effects from search engine results |
US9946722B2 (en) | 2007-11-30 | 2018-04-17 | Red Hat, Inc. | Generating file usage information |
US7895225B1 (en) * | 2007-12-06 | 2011-02-22 | Amazon Technologies, Inc. | Identifying potential duplicates of a document in a document corpus |
JP2009145953A (ja) * | 2007-12-11 | 2009-07-02 | Sharp Corp | データ検索装置、データ検索方法、コンピュータプログラム、及び記録媒体 |
US8176017B2 (en) * | 2007-12-14 | 2012-05-08 | Microsoft Corporation | Live volume access |
US9239882B2 (en) * | 2007-12-17 | 2016-01-19 | Iac Search & Media, Inc. | System and method for categorizing answers such as URLs |
US9501453B2 (en) | 2007-12-23 | 2016-11-22 | Salesforce.Com Inc. | Method and system for a flexible-data column user interface |
JP2009157422A (ja) * | 2007-12-25 | 2009-07-16 | Fuji Xerox Co Ltd | 操作制限情報管理システムおよびプログラム |
US8578260B2 (en) * | 2007-12-28 | 2013-11-05 | Business Objects Software Limited | Apparatus and method for reformatting a report for access by a user in a network appliance |
US20090182614A1 (en) * | 2008-01-11 | 2009-07-16 | Yahoo! Inc. | System And Method For Serving Advertisements According To Network Traffic |
US8752184B1 (en) * | 2008-01-17 | 2014-06-10 | Google Inc. | Spam detection for user-generated multimedia items based on keyword stuffing |
US8745056B1 (en) * | 2008-03-31 | 2014-06-03 | Google Inc. | Spam detection for user-generated multimedia items based on concept clustering |
US7860755B2 (en) * | 2008-02-19 | 2010-12-28 | The Go Daddy Group, Inc. | Rating e-commerce transactions |
US7653577B2 (en) * | 2008-02-19 | 2010-01-26 | The Go Daddy Group, Inc. | Validating e-commerce transactions |
US8881040B2 (en) | 2008-08-28 | 2014-11-04 | Georgetown University | System and method for detecting, collecting, analyzing, and communicating event-related information |
US9489495B2 (en) | 2008-02-25 | 2016-11-08 | Georgetown University | System and method for detecting, collecting, analyzing, and communicating event-related information |
US9529974B2 (en) | 2008-02-25 | 2016-12-27 | Georgetown University | System and method for detecting, collecting, analyzing, and communicating event-related information |
US9746985B1 (en) | 2008-02-25 | 2017-08-29 | Georgetown University | System and method for detecting, collecting, analyzing, and communicating event-related information |
US8224832B2 (en) * | 2008-02-29 | 2012-07-17 | Kemp Richard Douglas | Computerized document examination for changes |
US8171020B1 (en) | 2008-03-31 | 2012-05-01 | Google Inc. | Spam detection for user-generated multimedia items based on appearance in popular queries |
US8812493B2 (en) * | 2008-04-11 | 2014-08-19 | Microsoft Corporation | Search results ranking using editing distance and document information |
US8346791B1 (en) | 2008-05-16 | 2013-01-01 | Google Inc. | Search augmentation |
AU2009260033A1 (en) * | 2008-06-19 | 2009-12-23 | Wize Technologies, Inc. | System and method for aggregating and summarizing product/topic sentiment |
US20100010982A1 (en) * | 2008-07-09 | 2010-01-14 | Broder Andrei Z | Web content characterization based on semantic folksonomies associated with user generated content |
US8538942B2 (en) | 2008-09-12 | 2013-09-17 | Salesforce.Com, Inc. | Method and system for sharing documents between on-demand services |
US8370329B2 (en) * | 2008-09-22 | 2013-02-05 | Microsoft Corporation | Automatic search query suggestions with search result suggestions from user history |
US20100082649A1 (en) * | 2008-09-22 | 2010-04-01 | Microsoft Corporation | Automatic search suggestions from server-side user history |
KR101086530B1 (ko) * | 2008-10-02 | 2011-11-23 | 엔에이치엔(주) | 웹 문서 원본 판별 방법 및 시스템, 이를 위한 웹 문서 이력 정보 제공 방법 및 시스템 |
US20100169492A1 (en) * | 2008-12-04 | 2010-07-01 | The Go Daddy Group, Inc. | Generating domain names relevant to social website trending topics |
US8396865B1 (en) | 2008-12-10 | 2013-03-12 | Google Inc. | Sharing search engine relevance data between corpora |
US9152300B2 (en) | 2008-12-31 | 2015-10-06 | Tivo Inc. | Methods and techniques for adaptive search |
US10158823B2 (en) * | 2008-12-31 | 2018-12-18 | Tivo Solutions Inc. | Methods and techniques for adaptive search |
US8239397B2 (en) * | 2009-01-27 | 2012-08-07 | Palo Alto Research Center Incorporated | System and method for managing user attention by detecting hot and cold topics in social indexes |
JP2010176354A (ja) * | 2009-01-29 | 2010-08-12 | Fuji Xerox Co Ltd | 情報処理装置及び情報処理プログラム |
US8001462B1 (en) * | 2009-01-30 | 2011-08-16 | Google Inc. | Updating search engine document index based on calculated age of changed portions in a document |
US9836538B2 (en) * | 2009-03-03 | 2017-12-05 | Microsoft Technology Licensing, Llc | Domain-based ranking in document search |
CN101499098B (zh) * | 2009-03-04 | 2012-07-11 | 阿里巴巴集团控股有限公司 | 一种网页评估值的确定及运用的方法、系统 |
US8224839B2 (en) * | 2009-04-07 | 2012-07-17 | Microsoft Corporation | Search query extension |
US9009146B1 (en) | 2009-04-08 | 2015-04-14 | Google Inc. | Ranking search results based on similar queries |
CN101887437B (zh) * | 2009-05-12 | 2016-03-30 | 阿里巴巴集团控股有限公司 | 一种搜索结果生成方法及信息搜索系统 |
US8719298B2 (en) * | 2009-05-21 | 2014-05-06 | Microsoft Corporation | Click-through prediction for news queries |
US10353967B2 (en) * | 2009-06-22 | 2019-07-16 | Microsoft Technology Licensing, Llc | Assigning relevance weights based on temporal dynamics |
US20100332550A1 (en) * | 2009-06-26 | 2010-12-30 | Microsoft Corporation | Platform For Configurable Logging Instrumentation |
US20100332531A1 (en) * | 2009-06-26 | 2010-12-30 | Microsoft Corporation | Batched Transfer of Arbitrarily Distributed Data |
US9870572B2 (en) * | 2009-06-29 | 2018-01-16 | Google Llc | System and method of providing information based on street address |
US20150261858A1 (en) * | 2009-06-29 | 2015-09-17 | Google Inc. | System and method of providing information based on street address |
US8447760B1 (en) | 2009-07-20 | 2013-05-21 | Google Inc. | Generating a related set of documents for an initial set of documents |
EP2457182A4 (de) * | 2009-07-22 | 2014-01-15 | Foundationip Llc | Verfahren, system und vorrichtung zur bereitstellung von suchergebnissen aus einer elektronischen dokumentsammlung |
US20110029516A1 (en) * | 2009-07-30 | 2011-02-03 | Microsoft Corporation | Web-Used Pattern Insight Platform |
US8082247B2 (en) * | 2009-07-30 | 2011-12-20 | Microsoft Corporation | Best-bet recommendations |
GB2472250A (en) * | 2009-07-31 | 2011-02-02 | Stephen Timothy Morris | Method for determining document relevance |
JP5014386B2 (ja) * | 2009-08-12 | 2012-08-29 | ヤフー株式会社 | コンテンツ検索装置 |
US8498974B1 (en) | 2009-08-31 | 2013-07-30 | Google Inc. | Refining search results |
JP5002631B2 (ja) * | 2009-09-04 | 2012-08-15 | ヤフー株式会社 | 単語情報収集装置、単語情報収集方法および単語情報収集プログラム |
US8595194B2 (en) * | 2009-09-15 | 2013-11-26 | At&T Intellectual Property I, L.P. | Forward decay temporal data analysis |
US20110078017A1 (en) * | 2009-09-29 | 2011-03-31 | Selina Lam | Systems and methods for rating an originator of an online publication |
US8972391B1 (en) | 2009-10-02 | 2015-03-03 | Google Inc. | Recent interest based relevance scoring |
US8874555B1 (en) | 2009-11-20 | 2014-10-28 | Google Inc. | Modifying scoring data based on historical changes |
US8515975B1 (en) | 2009-12-07 | 2013-08-20 | Google Inc. | Search entity transition matrix and applications of the transition matrix |
US9043319B1 (en) * | 2009-12-07 | 2015-05-26 | Google Inc. | Generating real-time search results |
US20110145823A1 (en) * | 2009-12-10 | 2011-06-16 | The Go Daddy Group, Inc. | Task management engine |
US20110145822A1 (en) * | 2009-12-10 | 2011-06-16 | The Go Daddy Group, Inc. | Generating and recommending task solutions |
US8311792B1 (en) * | 2009-12-23 | 2012-11-13 | Intuit Inc. | System and method for ranking a posting |
US8655982B2 (en) * | 2009-12-28 | 2014-02-18 | Rakuten, Inc. | Information searching apparatus, number deciding method, information searching program, information searching system and recording medium |
US20110178868A1 (en) * | 2010-01-21 | 2011-07-21 | Priyank Shanker Garg | Enhancing search result pages using content licensed from content providers |
US8615514B1 (en) | 2010-02-03 | 2013-12-24 | Google Inc. | Evaluating website properties by partitioning user feedback |
EP2533163A4 (de) * | 2010-02-04 | 2015-04-15 | Ebay Inc | Listenanzeige auf basis von listenaktivitäten und entsprechenden anwendungen |
US8924379B1 (en) | 2010-03-05 | 2014-12-30 | Google Inc. | Temporal-based score adjustments |
US8959093B1 (en) | 2010-03-15 | 2015-02-17 | Google Inc. | Ranking search results based on anchors |
US8700642B2 (en) * | 2010-03-22 | 2014-04-15 | Microsoft Corporation | Software agent for monitoring content relevance |
US8650195B2 (en) * | 2010-03-26 | 2014-02-11 | Palle M Pedersen | Region based information retrieval system |
US8260789B2 (en) * | 2010-04-01 | 2012-09-04 | Microsoft Corporation | System and method for authority value obtained by defining ranking functions related to weight and confidence value |
CN101883180A (zh) * | 2010-05-11 | 2010-11-10 | 中兴通讯股份有限公司 | 屏蔽移动终端访问无线网络信息的方法、移动终端和系统 |
US9116990B2 (en) * | 2010-05-27 | 2015-08-25 | Microsoft Technology Licensing, Llc | Enhancing freshness of search results |
US8738635B2 (en) | 2010-06-01 | 2014-05-27 | Microsoft Corporation | Detection of junk in search result ranking |
US8738377B2 (en) | 2010-06-07 | 2014-05-27 | Google Inc. | Predicting and learning carrier phrases for speech input |
US8595207B2 (en) | 2010-06-14 | 2013-11-26 | Salesforce.Com | Methods and systems for dynamically suggesting answers to questions submitted to a portal of an online service |
US9623119B1 (en) | 2010-06-29 | 2017-04-18 | Google Inc. | Accentuating search results |
AU2010202901B2 (en) * | 2010-07-08 | 2016-04-14 | Patent Analytics Holding Pty Ltd | A system, method and computer program for preparing data for analysis |
US8832083B1 (en) | 2010-07-23 | 2014-09-09 | Google Inc. | Combining user feedback |
US9020922B2 (en) | 2010-08-10 | 2015-04-28 | Brightedge Technologies, Inc. | Search engine optimization at scale |
US20120047044A1 (en) * | 2010-08-19 | 2012-02-23 | Stephen James Lazuka | Method to Develop Search Engine Optimized Content Through a Web-Based Software Platform |
US8332408B1 (en) | 2010-08-23 | 2012-12-11 | Google Inc. | Date-based web page annotation |
US8762326B1 (en) | 2010-09-23 | 2014-06-24 | Google Inc. | Personalized hot topics |
US8346792B1 (en) | 2010-11-09 | 2013-01-01 | Google Inc. | Query generation using structural similarity between documents |
US8861896B2 (en) * | 2010-11-29 | 2014-10-14 | Sap Se | Method and system for image-based identification |
US9348925B2 (en) * | 2010-12-01 | 2016-05-24 | Google Inc. | Locally significant search queries |
WO2012075341A2 (en) | 2010-12-01 | 2012-06-07 | Google Inc. | Personal content streams based on user-topic profiles |
JP5673051B2 (ja) * | 2010-12-09 | 2015-02-18 | 日本電気株式会社 | 文書特徴量算出装置、文書特徴量算出方法、及び、文書特徴量算出プログラム |
US8793706B2 (en) | 2010-12-16 | 2014-07-29 | Microsoft Corporation | Metadata-based eventing supporting operations on data |
US9002867B1 (en) | 2010-12-30 | 2015-04-07 | Google Inc. | Modifying ranking data based on document changes |
US8972412B1 (en) | 2011-01-31 | 2015-03-03 | Go Daddy Operating Company, LLC | Predicting improvement in website search engine rankings based upon website linking relationships |
US8370365B1 (en) | 2011-01-31 | 2013-02-05 | Go Daddy Operating Company, LLC | Tools for predicting improvement in website search engine rankings based upon website linking relationships |
US10162892B2 (en) * | 2011-02-28 | 2018-12-25 | International Business Machines Corporation | Identifying information assets within an enterprise using a semantic graph created using feedback re-enforced search and navigation |
US9646110B2 (en) | 2011-02-28 | 2017-05-09 | International Business Machines Corporation | Managing information assets using feedback re-enforced search and navigation |
WO2012129102A2 (en) * | 2011-03-22 | 2012-09-27 | Brightedge Technologies, Inc. | Detection and analysis of backlink activity |
US8732151B2 (en) | 2011-04-01 | 2014-05-20 | Microsoft Corporation | Enhanced query rewriting through statistical machine translation |
EP2700025A4 (de) * | 2011-04-19 | 2014-10-22 | Nokia Corp | Verfahren und vorrichtung für flexible diversifikation von empfehlungsergebnissen |
US8775431B2 (en) * | 2011-04-25 | 2014-07-08 | Disney Enterprises, Inc. | Systems and methods for hot topic identification and metadata |
US8819000B1 (en) * | 2011-05-03 | 2014-08-26 | Google Inc. | Query modification |
US20120304072A1 (en) * | 2011-05-23 | 2012-11-29 | Microsoft Corporation | Sentiment-based content aggregation and presentation |
US10068022B2 (en) * | 2011-06-03 | 2018-09-04 | Google Llc | Identifying topical entities |
US10223451B2 (en) * | 2011-06-14 | 2019-03-05 | International Business Machines Corporation | Ranking search results based upon content creation trends |
US8898151B2 (en) * | 2011-06-22 | 2014-11-25 | Rogers Communications Inc. | System and method for filtering documents |
US9384193B2 (en) | 2011-07-15 | 2016-07-05 | International Business Machines Corporation | Use and enforcement of provenance and lineage constraints |
US9286334B2 (en) | 2011-07-15 | 2016-03-15 | International Business Machines Corporation | Versioning of metadata, including presentation of provenance and lineage for versioned metadata |
US8510285B1 (en) * | 2011-08-18 | 2013-08-13 | Google Inc. | Using pre-search triggers |
JP5506104B2 (ja) * | 2011-09-30 | 2014-05-28 | 楽天株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
KR101510647B1 (ko) * | 2011-10-07 | 2015-04-10 | 한국전자통신연구원 | 이슈 템플릿 추출 기반의 웹 동향 분석 방법 및 장치 |
US10776431B2 (en) * | 2011-10-26 | 2020-09-15 | Oath Inc. | System and method for recommending content based on search history and trending topics |
US8694507B2 (en) * | 2011-11-02 | 2014-04-08 | Microsoft Corporation | Tenantization of search result ranking |
WO2013070977A1 (en) * | 2011-11-10 | 2013-05-16 | Room 77, Inc. | Metasearch infrastructure with incremental updates |
US9436758B1 (en) | 2011-12-27 | 2016-09-06 | Google Inc. | Methods and systems for partitioning documents having customer feedback and support content |
US8868536B1 (en) * | 2012-01-04 | 2014-10-21 | Google Inc. | Real time map spam detection |
US9201964B2 (en) | 2012-01-23 | 2015-12-01 | Microsoft Technology Licensing, Llc | Identifying related entities |
US9418065B2 (en) | 2012-01-26 | 2016-08-16 | International Business Machines Corporation | Tracking changes related to a collection of documents |
US9495462B2 (en) | 2012-01-27 | 2016-11-15 | Microsoft Technology Licensing, Llc | Re-ranking search results |
JP5929356B2 (ja) * | 2012-03-15 | 2016-06-01 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
US9189526B1 (en) * | 2012-03-21 | 2015-11-17 | Google Inc. | Freshness based ranking |
CN103049511B (zh) * | 2012-03-28 | 2016-02-03 | 温州大学 | 一种微博关注列表、微博内容的显示方法及其客户端 |
US9081831B2 (en) | 2012-03-30 | 2015-07-14 | Google Inc. | Methods and systems for presenting document-specific snippets |
CN103377191B (zh) * | 2012-04-12 | 2017-04-12 | 阿里巴巴集团控股有限公司 | 一种提供图片的相关信息的方法及装置 |
US20130282707A1 (en) * | 2012-04-24 | 2013-10-24 | Discovery Engine Corporation | Two-step combiner for search result scores |
US9916396B2 (en) | 2012-05-11 | 2018-03-13 | Google Llc | Methods and systems for content-based search |
US8954438B1 (en) | 2012-05-31 | 2015-02-10 | Google Inc. | Structured metadata extraction |
US8924375B1 (en) * | 2012-05-31 | 2014-12-30 | Symantec Corporation | Item attention tracking system and method |
US8984012B2 (en) * | 2012-06-20 | 2015-03-17 | Microsoft Technology Licensing, Llc | Self-tuning alterations framework |
US9471606B1 (en) | 2012-06-25 | 2016-10-18 | Google Inc. | Obtaining information to provide to users |
US9195717B2 (en) * | 2012-06-26 | 2015-11-24 | Google Inc. | Image result provisioning based on document classification |
US9436687B2 (en) * | 2012-07-09 | 2016-09-06 | Facebook, Inc. | Acquiring structured user data using composer interface having input fields corresponding to acquired structured data |
US9110852B1 (en) | 2012-07-20 | 2015-08-18 | Google Inc. | Methods and systems for extracting information from text |
US8793258B2 (en) * | 2012-07-31 | 2014-07-29 | Hewlett-Packard Development Company, L.P. | Predicting sharing on a social network |
US9390174B2 (en) | 2012-08-08 | 2016-07-12 | Google Inc. | Search result ranking and presentation |
US8938438B2 (en) | 2012-10-11 | 2015-01-20 | Go Daddy Operating Company, LLC | Optimizing search engine ranking by recommending content including frequently searched questions |
US8898113B2 (en) | 2012-11-21 | 2014-11-25 | International Business Machines Corporation | Managing replicated data |
US9558233B1 (en) | 2012-11-30 | 2017-01-31 | Google Inc. | Determining a quality measure for a resource |
US9256682B1 (en) | 2012-12-05 | 2016-02-09 | Google Inc. | Providing search results based on sorted properties |
US8949228B2 (en) * | 2013-01-15 | 2015-02-03 | Google Inc. | Identification of new sources for topics |
US20140236964A1 (en) * | 2013-02-19 | 2014-08-21 | Lexisnexis, A Division Of Reed Elsevier Inc. | Systems And Methods For Ranking A Plurality Of Documents Based On User Activity |
US9218819B1 (en) | 2013-03-01 | 2015-12-22 | Google Inc. | Customizing actions based on contextual data and voice-based inputs |
US11429651B2 (en) * | 2013-03-14 | 2022-08-30 | International Business Machines Corporation | Document provenance scoring based on changes between document versions |
US9477759B2 (en) | 2013-03-15 | 2016-10-25 | Google Inc. | Question answering using entity references in unstructured data |
US10055462B2 (en) | 2013-03-15 | 2018-08-21 | Google Llc | Providing search results using augmented search queries |
US10108700B2 (en) | 2013-03-15 | 2018-10-23 | Google Llc | Question answering to populate knowledge base |
US9501506B1 (en) | 2013-03-15 | 2016-11-22 | Google Inc. | Indexing system |
ES2518015B1 (es) * | 2013-04-01 | 2015-08-12 | Crambo, S.A. | Método, dispositivo móvil, sistema y producto informático para la detección y medición del nivel de atención de un usuario |
US9183499B1 (en) | 2013-04-19 | 2015-11-10 | Google Inc. | Evaluating quality based on neighbor features |
US9251146B2 (en) | 2013-05-10 | 2016-02-02 | International Business Machines Corporation | Altering relevancy of a document and/or a search query |
CN105247481B (zh) * | 2013-05-29 | 2019-05-07 | 惠普发展公司,有限责任合伙企业 | 用于网页输出选择的计算系统、方法和机器可读非暂时性存储介质 |
US9483568B1 (en) | 2013-06-05 | 2016-11-01 | Google Inc. | Indexing system |
RU2592390C2 (ru) * | 2013-07-15 | 2016-07-20 | Общество С Ограниченной Ответственностью "Яндекс" | Система, способ и устройство для оценки сеансов просмотра |
US20150046219A1 (en) * | 2013-08-08 | 2015-02-12 | Mark J. Shavlik | Avatar-based automated lead scoring system |
US9946804B2 (en) | 2013-08-19 | 2018-04-17 | Business Objects Software Ltd | Displaying historical data associated with data values within business intelligence reports |
US20150058073A1 (en) * | 2013-08-20 | 2015-02-26 | Dmitrii Gorbunov | Crowdsourced innovation exchange |
US9723053B1 (en) | 2013-08-30 | 2017-08-01 | Amazon Technologies, Inc. | Pre-fetching a cacheable network resource based on a time-to-live value |
WO2015038881A1 (en) * | 2013-09-13 | 2015-03-19 | ClickTale, Ltd. | A method and system for generating comparable visual maps for browsing activity analysis |
US10902004B2 (en) * | 2013-10-16 | 2021-01-26 | Salesforce.Com, Inc. | Processing user-submitted updates based on user reliability scores |
US11017426B1 (en) * | 2013-12-20 | 2021-05-25 | BloomReach Inc. | Content performance analytics |
CN104753805B (zh) * | 2013-12-31 | 2018-07-24 | 腾讯科技(深圳)有限公司 | 分布式流量控制方法、服务器和系统 |
US20150186463A1 (en) * | 2013-12-31 | 2015-07-02 | International Business Machines Corporation | Identifying changes to query results system and method |
US9984165B2 (en) * | 2014-02-13 | 2018-05-29 | Amadeus S.A.S. | Increasing search result validity |
US9582536B2 (en) | 2014-02-19 | 2017-02-28 | Amadeus S.A.S. | Long-term validity of pre-computed request results |
US9471689B2 (en) | 2014-05-29 | 2016-10-18 | International Business Machines Corporation | Managing documents in question answering systems |
US9875242B2 (en) * | 2014-06-03 | 2018-01-23 | Google Llc | Dynamic current results for second device |
US9692804B2 (en) | 2014-07-04 | 2017-06-27 | Yandex Europe Ag | Method of and system for determining creation time of a web resource |
US9934319B2 (en) | 2014-07-04 | 2018-04-03 | Yandex Europe Ag | Method of and system for determining creation time of a web resource |
US10601749B1 (en) | 2014-07-11 | 2020-03-24 | Twitter, Inc. | Trends in a messaging platform |
JP2017521396A (ja) * | 2014-07-11 | 2017-08-03 | セルジーン コーポレイション | 癌のための併用療法 |
US10592539B1 (en) * | 2014-07-11 | 2020-03-17 | Twitter, Inc. | Trends in a messaging platform |
US10810249B2 (en) * | 2014-08-05 | 2020-10-20 | Piksel, Inc. | Content source driven recommendation for given context of content delivery and display system |
US9703840B2 (en) | 2014-08-13 | 2017-07-11 | International Business Machines Corporation | Handling information source ingestion in a question answering system |
US10459927B1 (en) | 2014-08-15 | 2019-10-29 | Groupon, Inc. | Enforcing diversity in ranked relevance results returned from a universal relevance service framework |
US11216843B1 (en) | 2014-08-15 | 2022-01-04 | Groupon, Inc. | Ranked relevance results using multi-feature scoring returned from a universal relevance service framework |
US10572925B1 (en) | 2014-08-15 | 2020-02-25 | Groupon, Inc. | Universal relevance service framework |
US10210214B2 (en) * | 2014-08-27 | 2019-02-19 | International Business Machines Corporation | Scalable trend detection in a personalized search context |
US9767172B2 (en) * | 2014-10-03 | 2017-09-19 | Palantir Technologies Inc. | Data aggregation and analysis system |
US9501851B2 (en) | 2014-10-03 | 2016-11-22 | Palantir Technologies Inc. | Time-series analysis system |
US9690862B2 (en) * | 2014-10-18 | 2017-06-27 | International Business Machines Corporation | Realtime ingestion via multi-corpus knowledge base with weighting |
US10042514B2 (en) * | 2014-10-30 | 2018-08-07 | Microsoft Technology Licensing, Llc | Typeahead features |
RU2610280C2 (ru) | 2014-10-31 | 2017-02-08 | Общество С Ограниченной Ответственностью "Яндекс" | Способ авторизации пользователя в сети и сервер, используемый в нем |
US9785304B2 (en) | 2014-10-31 | 2017-10-10 | Bank Of America Corporation | Linking customer profiles with household profiles |
US9922117B2 (en) | 2014-10-31 | 2018-03-20 | Bank Of America Corporation | Contextual search input from advisors |
RU2580432C1 (ru) | 2014-10-31 | 2016-04-10 | Общество С Ограниченной Ответственностью "Яндекс" | Способ для обработки запроса от потенциального несанкционированного пользователя на доступ к ресурсу и серверу, используемый в нем |
US9940409B2 (en) * | 2014-10-31 | 2018-04-10 | Bank Of America Corporation | Contextual search tool |
US9160680B1 (en) | 2014-11-18 | 2015-10-13 | Kaspersky Lab Zao | System and method for dynamic network resource categorization re-assignment |
CN104778202B (zh) * | 2015-02-05 | 2018-08-14 | 北京航空航天大学 | 基于关键词的事件演化过程的分析方法及系统 |
US9836435B2 (en) | 2015-03-19 | 2017-12-05 | International Business Machines Corporation | Embedded content suitability scoring |
CN104731914A (zh) * | 2015-03-24 | 2015-06-24 | 浪潮集团有限公司 | 一种基于行为相似度的用户异常行为检测方法 |
US9984330B2 (en) | 2015-04-10 | 2018-05-29 | Microsoft Technology Licensing, Llc. | Predictive trending of digital entities |
US11803918B2 (en) | 2015-07-07 | 2023-10-31 | Oracle International Corporation | System and method for identifying experts on arbitrary topics in an enterprise social network |
RU2632131C2 (ru) * | 2015-08-28 | 2017-10-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и устройство для создания рекомендуемого списка содержимого |
RU2629638C2 (ru) | 2015-09-28 | 2017-08-30 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и сервер создания рекомендуемого набора элементов для пользователя |
RU2632100C2 (ru) * | 2015-09-28 | 2017-10-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и сервер создания рекомендованного набора элементов |
US11442945B1 (en) * | 2015-12-31 | 2022-09-13 | Groupon, Inc. | Dynamic freshness for relevance rankings |
CA3014072A1 (en) | 2016-02-08 | 2017-08-17 | Acxiom Corporation | Change fingerprinting for database tables, text files, and data feeds |
RU2632144C1 (ru) | 2016-05-12 | 2017-10-02 | Общество С Ограниченной Ответственностью "Яндекс" | Компьютерный способ создания интерфейса рекомендации контента |
RU2636702C1 (ru) | 2016-07-07 | 2017-11-27 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и устройство для выбора сетевого ресурса в качестве источника содержимого для системы рекомендаций |
RU2632132C1 (ru) | 2016-07-07 | 2017-10-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и устройство для создания рекомендаций содержимого в системе рекомендаций |
US10769156B2 (en) * | 2016-08-26 | 2020-09-08 | Microsoft Technology Licensing, Llc | Rank query results for relevance utilizing external context |
USD882600S1 (en) | 2017-01-13 | 2020-04-28 | Yandex Europe Ag | Display screen with graphical user interface |
CN107622090B (zh) * | 2017-08-22 | 2020-10-16 | 上海艾融软件股份有限公司 | 对象的获取方法、装置及系统 |
US10853375B1 (en) | 2017-08-25 | 2020-12-01 | Roblox Corporation | Leveraging historical data to improve the relevancy of search results |
CN109446402B (zh) * | 2017-08-29 | 2022-04-01 | 阿里巴巴集团控股有限公司 | 一种搜索方法及装置 |
US11163759B2 (en) * | 2017-12-21 | 2021-11-02 | Salesforce.Com, Inc. | Predicting entities for database query results |
CN110569335B (zh) * | 2018-03-23 | 2022-05-27 | 百度在线网络技术(北京)有限公司 | 基于人工智能的三元组校验方法、装置及存储介质 |
US11514095B2 (en) | 2018-05-04 | 2022-11-29 | International Business Machines Corporation | Tiered retrieval of secured documents |
US10796022B2 (en) | 2018-05-16 | 2020-10-06 | Ebay Inc. | Weighted source data secured on blockchains |
US10671371B2 (en) | 2018-06-12 | 2020-06-02 | International Business Machines Corporation | Alerting an offline user of a predicted computer file update |
US11017221B2 (en) | 2018-07-01 | 2021-05-25 | International Business Machines Corporation | Classifying digital documents in multi-document transactions based on embedded dates |
US10885081B2 (en) | 2018-07-02 | 2021-01-05 | Optum Technology, Inc. | Systems and methods for contextual ranking of search results |
GB201811003D0 (en) | 2018-07-04 | 2018-08-15 | Bp Plc | Multiple cooling circuit systems and methods for using them |
RU2714594C1 (ru) | 2018-09-14 | 2020-02-18 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система определения параметра релевантность для элементов содержимого |
RU2720952C2 (ru) | 2018-09-14 | 2020-05-15 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система для создания рекомендации цифрового содержимого |
RU2720899C2 (ru) | 2018-09-14 | 2020-05-14 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система для определения зависящих от пользователя пропорций содержимого для рекомендации |
US11294974B1 (en) * | 2018-10-04 | 2022-04-05 | Apple Inc. | Golden embeddings |
RU2725659C2 (ru) | 2018-10-08 | 2020-07-03 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система для оценивания данных о взаимодействиях пользователь-элемент |
RU2731335C2 (ru) | 2018-10-09 | 2020-09-01 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система для формирования рекомендаций цифрового контента |
US11003889B2 (en) | 2018-10-22 | 2021-05-11 | International Business Machines Corporation | Classifying digital documents in multi-document transactions based on signatory role analysis |
US11677703B2 (en) | 2019-08-15 | 2023-06-13 | Rovi Guides, Inc. | Systems and methods for automatically identifying spam in social media comments based on context |
US11258741B2 (en) * | 2019-08-15 | 2022-02-22 | Rovi Guides, Inc. | Systems and methods for automatically identifying spam in social media comments |
RU2757406C1 (ru) | 2019-09-09 | 2021-10-15 | Общество С Ограниченной Ответственностью «Яндекс» | Способ и система для обеспечения уровня сервиса при рекламе элемента контента |
KR102426056B1 (ko) * | 2019-10-30 | 2022-07-27 | 네이버 주식회사 | 문서 선별을 위해 멀티모달 어뷰징 패턴을 감지하는 방법, 시스템, 및 컴퓨터 프로그램 |
JP2021077256A (ja) * | 2019-11-13 | 2021-05-20 | 株式会社Fronteo | 文書処理装置、文書レビューシステム、文書処理装置の制御方法、文書レビューサービスを提供する方法、および制御プログラム |
JP7262871B2 (ja) | 2020-11-04 | 2023-04-24 | データ・サイエンティスト株式会社 | 検索ニーズ評価プログラム、検索ニーズ評価装置および検索ニーズ評価方法、ならびに、評価プログラム、評価装置および評価方法 |
CN112783837B (zh) * | 2021-01-12 | 2024-01-30 | 北京首汽智行科技有限公司 | 一种api文档查找方法 |
US12126728B2 (en) * | 2021-06-15 | 2024-10-22 | Whitestar Communications, Inc. | Anti-replay protection based on hashing encrypted temporal key in a secure peer-to-peer data network |
CN114090935B (zh) * | 2021-11-25 | 2024-10-29 | 马上消费金融股份有限公司 | 数据采集方法及装置 |
US11914906B2 (en) * | 2022-05-17 | 2024-02-27 | Kyocera Document Solutions Inc. | Pre-processing print jobs |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6285999B1 (en) | 1997-01-10 | 2001-09-04 | The Board Of Trustees Of The Leland Stanford Junior University | Method for node ranking in a linked database |
Family Cites Families (144)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5594897A (en) * | 1993-09-01 | 1997-01-14 | Gwg Associates | Method for retrieving high relevance, high quality objects from an overall source |
US5465353A (en) * | 1994-04-01 | 1995-11-07 | Ricoh Company, Ltd. | Image matching and retrieval by multi-access redundant hashing |
GB9408894D0 (en) * | 1994-05-05 | 1994-06-22 | Secr Defence | Electronic circuit |
US5758257A (en) * | 1994-11-29 | 1998-05-26 | Herz; Frederick | System and method for scheduling broadcast of and access to video programs and other data using customer profiles |
JP2914226B2 (ja) | 1995-06-16 | 1999-06-28 | 日本電気株式会社 | 可逆変換を可能にするディジタル信号の変換符号化方式 |
US5742816A (en) * | 1995-09-15 | 1998-04-21 | Infonautics Corporation | Method and apparatus for identifying textual documents and multi-mediafiles corresponding to a search topic |
US5873076A (en) * | 1995-09-15 | 1999-02-16 | Infonautics Corporation | Architecture for processing search queries, retrieving documents identified thereby, and method for using same |
US5918014A (en) * | 1995-12-27 | 1999-06-29 | Athenium, L.L.C. | Automated collaborative filtering in world wide web advertising |
US6457004B1 (en) * | 1997-07-03 | 2002-09-24 | Hitachi, Ltd. | Document retrieval assisting method, system and service using closely displayed areas for titles and topics |
US6092091A (en) * | 1996-09-13 | 2000-07-18 | Kabushiki Kaisha Toshiba | Device and method for filtering information, device and method for monitoring updated document information and information storage medium used in same devices |
JPH10247201A (ja) * | 1997-03-05 | 1998-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 情報評価値付き情報案内システム |
US7636732B1 (en) * | 1997-05-30 | 2009-12-22 | Sun Microsystems, Inc. | Adaptive meta-tagging of websites |
US5893111A (en) * | 1997-06-13 | 1999-04-06 | Sharon, Jr.; Paul A. | Ad taking pagination information system |
US6014665A (en) | 1997-08-01 | 2000-01-11 | Culliss; Gary | Method for organizing information |
US6182068B1 (en) | 1997-08-01 | 2001-01-30 | Ask Jeeves, Inc. | Personalized search methods |
US6078916A (en) | 1997-08-01 | 2000-06-20 | Culliss; Gary | Method for organizing information |
US5956722A (en) * | 1997-09-23 | 1999-09-21 | At&T Corp. | Method for effective indexing of partially dynamic documents |
US6389436B1 (en) * | 1997-12-15 | 2002-05-14 | International Business Machines Corporation | Enhanced hypertext categorization using hyperlinks |
US6067565A (en) * | 1998-01-15 | 2000-05-23 | Microsoft Corporation | Technique for prefetching a web page of potential future interest in lieu of continuing a current information download |
US6163778A (en) | 1998-02-06 | 2000-12-19 | Sun Microsystems, Inc. | Probabilistic web link viability marker and web page ratings |
US6182133B1 (en) * | 1998-02-06 | 2001-01-30 | Microsoft Corporation | Method and apparatus for display of information prefetching and cache status having variable visual indication based on a period of time since prefetching |
WO1999041694A1 (en) * | 1998-02-13 | 1999-08-19 | Yahoo, Inc. | Search engine using sales and revenue to weight search results |
US6185558B1 (en) | 1998-03-03 | 2001-02-06 | Amazon.Com, Inc. | Identifying the items most relevant to a current query based on items selected in connection with similar queries |
US6421675B1 (en) * | 1998-03-16 | 2002-07-16 | S. L. I. Systems, Inc. | Search engine |
US6457028B1 (en) * | 1998-03-18 | 2002-09-24 | Xerox Corporation | Method and apparatus for finding related collections of linked documents using co-citation analysis |
US6990437B1 (en) * | 1999-07-02 | 2006-01-24 | Abu El Ata Nabil A | Systems and method for determining performance metrics for constructing information systems |
US6638314B1 (en) * | 1998-06-26 | 2003-10-28 | Microsoft Corporation | Method of web crawling utilizing crawl numbers |
US6421375B1 (en) * | 1998-07-28 | 2002-07-16 | Conexant Systems, Inc | Method and apparatus for transmitting control signals in a data communication system having a fully digital communication channel |
US7765179B2 (en) * | 1998-12-01 | 2010-07-27 | Alcatel-Lucent Usa Inc. | Method and apparatus for resolving domain names of persistent web resources |
US6615242B1 (en) * | 1998-12-28 | 2003-09-02 | At&T Corp. | Automatic uniform resource locator-based message filter |
US6598054B2 (en) * | 1999-01-26 | 2003-07-22 | Xerox Corporation | System and method for clustering data objects in a collection |
JP3347088B2 (ja) * | 1999-02-12 | 2002-11-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 関連情報検索方法およびシステム |
US6510406B1 (en) * | 1999-03-23 | 2003-01-21 | Mathsoft, Inc. | Inverse inference engine for high performance web search |
US6907566B1 (en) * | 1999-04-02 | 2005-06-14 | Overture Services, Inc. | Method and system for optimum placement of advertisements on a webpage |
US7752251B1 (en) * | 2000-04-14 | 2010-07-06 | Brian Mark Shuster | Method, apparatus and system for hosting information exchange groups on a wide area network |
US6385611B1 (en) * | 1999-05-07 | 2002-05-07 | Carlos Cardona | System and method for database retrieval, indexing and statistical analysis |
US6350271B1 (en) | 1999-05-17 | 2002-02-26 | Micrus Corporation | Clot retrieval device |
JP2000339316A (ja) | 1999-05-25 | 2000-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 検索連動型情報収集方法、装置及びその方法を記憶した記録媒体 |
US7110993B2 (en) * | 1999-05-28 | 2006-09-19 | Overture Services, Inc. | System and method for influencing a position on a search result list generated by a computer network search engine |
US6269361B1 (en) | 1999-05-28 | 2001-07-31 | Goto.Com | System and method for influencing a position on a search result list generated by a computer network search engine |
JP2001005705A (ja) * | 1999-06-22 | 2001-01-12 | Hitachi Ltd | 文書情報管理システム |
US6665665B1 (en) * | 1999-07-30 | 2003-12-16 | Verizon Laboratories Inc. | Compressed document surrogates |
US6321228B1 (en) * | 1999-08-31 | 2001-11-20 | Powercast Media, Inc. | Internet search system for retrieving selected results from a previous search |
US6839680B1 (en) * | 1999-09-30 | 2005-01-04 | Fujitsu Limited | Internet profiling |
AU1797401A (en) * | 1999-11-22 | 2001-06-04 | Avenue, A, Inc. | Targeting electronic advertising placement in accordance with an analysis of user inclination and affinity |
US6751612B1 (en) * | 1999-11-29 | 2004-06-15 | Xerox Corporation | User query generate search results that rank set of servers where ranking is based on comparing content on each server with user query, frequency at which content on each server is altered using web crawler in a search engine |
EP1107128A1 (de) * | 1999-12-03 | 2001-06-13 | Hyundai Electronics Industries Co., Ltd. | Vorrichtung und Verfahren zur überprüfung der Gültigkeit von Querverweisen in einem Netzwerk von Computern |
AUPQ475799A0 (en) * | 1999-12-20 | 2000-01-20 | Youramigo Pty Ltd | An internet indexing system and method |
WO2001052462A2 (en) * | 2000-01-12 | 2001-07-19 | Jupiter Media Metrix, Inc. | System and method for estimating prevalence of digital content on the world-wide-web |
US6546388B1 (en) * | 2000-01-14 | 2003-04-08 | International Business Machines Corporation | Metadata search results ranking system |
US6883135B1 (en) * | 2000-01-28 | 2005-04-19 | Microsoft Corporation | Proxy server using a statistical model |
CA2400161C (en) * | 2000-02-22 | 2015-11-24 | Metacarta, Inc. | Spatially coding and displaying information |
US7567958B1 (en) * | 2000-04-04 | 2009-07-28 | Aol, Llc | Filtering system for providing personalized information in the absence of negative data |
US20010030773A1 (en) * | 2000-04-17 | 2001-10-18 | Satoshi Matsuura | Digital photograph system |
JP3562572B2 (ja) * | 2000-05-02 | 2004-09-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データベースのドキュメントにおける新規な事項・新規クラスの検出及び追跡 |
US6789076B1 (en) * | 2000-05-11 | 2004-09-07 | International Business Machines Corp. | System, method and program for augmenting information retrieval in a client/server network using client-side searching |
JP2001326635A (ja) * | 2000-05-16 | 2001-11-22 | Matsushita Electric Ind Co Ltd | インターネットの課金システム |
AU2001264928A1 (en) * | 2000-05-25 | 2001-12-03 | Kanisa Inc. | System and method for automatically classifying text |
JP2002007801A (ja) | 2000-06-21 | 2002-01-11 | Nec Corp | オンラインショッピングシステム、信用情報提供サーバー、提供方法および提供プログラムを記録した記録媒体 |
US20020022999A1 (en) * | 2000-06-23 | 2002-02-21 | Shuster Brian Mark | Method and apparatus for providing audio advertisements in a computer network |
US7003513B2 (en) | 2000-07-04 | 2006-02-21 | International Business Machines Corporation | Method and system of weighted context feedback for result improvement in information retrieval |
JP2002024065A (ja) | 2000-07-07 | 2002-01-25 | Ricoh Co Ltd | 文書管理システム、文書管理方法およびその方法を実施するためのプログラムを記録した記録媒体 |
US7080073B1 (en) * | 2000-08-18 | 2006-07-18 | Firstrain, Inc. | Method and apparatus for focused crawling |
US7146416B1 (en) * | 2000-09-01 | 2006-12-05 | Yahoo! Inc. | Web site activity monitoring system with tracking by categories and terms |
NO313399B1 (no) * | 2000-09-14 | 2002-09-23 | Fast Search & Transfer Asa | Fremgangsmate til soking og analyse av informasjon i datanettverk |
AUPR033800A0 (en) * | 2000-09-25 | 2000-10-19 | Telstra R & D Management Pty Ltd | A document categorisation system |
US6684205B1 (en) * | 2000-10-18 | 2004-01-27 | International Business Machines Corporation | Clustering hypertext with applications to web searching |
JP3934325B2 (ja) * | 2000-10-31 | 2007-06-20 | 株式会社日立製作所 | 文書検索方法、文書検索装置及び文書検索プログラムの記憶媒体 |
FR2816734B1 (fr) * | 2000-11-15 | 2003-03-14 | Linkkit | Procede de recherche, de selection et de representation cartographique de pages web |
US8862656B2 (en) | 2000-11-21 | 2014-10-14 | Chironet, Llc | Performance outcomes benchmarking |
US7130889B2 (en) | 2000-11-29 | 2006-10-31 | Ncr Corporation | Method of printing information by a network kiosk |
US20020078045A1 (en) * | 2000-12-14 | 2002-06-20 | Rabindranath Dutta | System, method, and program for ranking search results using user category weighting |
JP2002183216A (ja) * | 2000-12-18 | 2002-06-28 | Fuji Electric Co Ltd | 時系列情報蓄積・再生装置 |
US7356530B2 (en) * | 2001-01-10 | 2008-04-08 | Looksmart, Ltd. | Systems and methods of retrieving relevant information |
US7359944B2 (en) * | 2001-02-07 | 2008-04-15 | Lg Electronics Inc. | Method of providing digital electronic book |
JP2002245070A (ja) * | 2001-02-20 | 2002-08-30 | Hitachi Ltd | データ表示方法及び装置並びにその処理プログラムを記憶した媒体 |
US8001118B2 (en) * | 2001-03-02 | 2011-08-16 | Google Inc. | Methods and apparatus for employing usage statistics in document retrieval |
US20030018659A1 (en) * | 2001-03-14 | 2003-01-23 | Lingomotors, Inc. | Category-based selections in an information access environment |
US20020188635A1 (en) * | 2001-03-20 | 2002-12-12 | Larson Stephen C. | System and method for incorporation of print-ready advertisement in digital newspaper editions |
US20020161838A1 (en) * | 2001-04-27 | 2002-10-31 | Pickover Cilfford A. | Method and apparatus for targeting information |
US7194483B1 (en) * | 2001-05-07 | 2007-03-20 | Intelligenxia, Inc. | Method, system, and computer program product for concept-based multi-dimensional analysis of unstructured information |
US7299219B2 (en) * | 2001-05-08 | 2007-11-20 | The Johns Hopkins University | High refresh-rate retrieval of freshly published content using distributed crawling |
JP4489994B2 (ja) * | 2001-05-11 | 2010-06-23 | 富士通株式会社 | 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体 |
JP4025517B2 (ja) * | 2001-05-31 | 2007-12-19 | 株式会社日立製作所 | 文書検索システムおよびサーバ |
US7035772B2 (en) * | 2001-05-31 | 2006-04-25 | International Business Machines Corporation | Method and apparatus for calculating data integrity metrics for web server activity log analysis |
US7058624B2 (en) * | 2001-06-20 | 2006-06-06 | Hewlett-Packard Development Company, L.P. | System and method for optimizing search results |
US7299270B2 (en) * | 2001-07-10 | 2007-11-20 | Lycos, Inc. | Inferring relations between internet objects that are not connected directly |
US7146409B1 (en) | 2001-07-24 | 2006-12-05 | Brightplanet Corporation | System and method for efficient control and capture of dynamic database content |
JP2003046764A (ja) | 2001-08-03 | 2003-02-14 | Matsushita Graphic Communication Systems Inc | 紙面伝送システム及び紙面伝送方法 |
US7076483B2 (en) * | 2001-08-27 | 2006-07-11 | Xyleme Sa | Ranking nodes in a graph |
US20040205454A1 (en) * | 2001-08-28 | 2004-10-14 | Simon Gansky | System, method and computer program product for creating a description for a document of a remote network data source for later identification of the document and identifying the document utilizing a description |
US20030046098A1 (en) * | 2001-09-06 | 2003-03-06 | Seong-Gon Kim | Apparatus and method that modifies the ranking of the search results by the number of votes cast by end-users and advertisers |
JP4283466B2 (ja) * | 2001-10-12 | 2009-06-24 | 富士通株式会社 | リンク関係に基づく文書整理方法 |
JP2003122699A (ja) | 2001-10-15 | 2003-04-25 | Toshiba Corp | 情報処理システムとその周辺機器 |
US6944609B2 (en) * | 2001-10-18 | 2005-09-13 | Lycos, Inc. | Search results using editor feedback |
US20030101126A1 (en) * | 2001-11-13 | 2003-05-29 | Cheung Dominic Dough-Ming | Position bidding in a pay for placement database search system |
US20030101166A1 (en) * | 2001-11-26 | 2003-05-29 | Fujitsu Limited | Information analyzing method and system |
US6763362B2 (en) | 2001-11-30 | 2004-07-13 | Micron Technology, Inc. | Method and system for updating a search engine |
US7249034B2 (en) * | 2002-01-14 | 2007-07-24 | International Business Machines Corporation | System and method for publishing a person's affinities |
US7565367B2 (en) * | 2002-01-15 | 2009-07-21 | Iac Search & Media, Inc. | Enhanced popularity ranking |
US20110066510A1 (en) * | 2002-01-16 | 2011-03-17 | Galip Talegon | Methods for valuing and placing advertising |
US20030135460A1 (en) * | 2002-01-16 | 2003-07-17 | Galip Talegon | Methods for valuing and placing advertising |
JP4003468B2 (ja) * | 2002-02-05 | 2007-11-07 | 株式会社日立製作所 | 適合性フィードバックによる類似データ検索方法および装置 |
US20040205569A1 (en) * | 2002-02-06 | 2004-10-14 | Mccarty Jon S. | Method and system to manage outdated web page links in a computing system |
US7343365B2 (en) * | 2002-02-20 | 2008-03-11 | Microsoft Corporation | Computer system architecture for automatic context associations |
US7188107B2 (en) * | 2002-03-06 | 2007-03-06 | Infoglide Software Corporation | System and method for classification of documents |
US7203909B1 (en) * | 2002-04-04 | 2007-04-10 | Microsoft Corporation | System and methods for constructing personalized context-sensitive portal pages or views by analyzing patterns of users' information access activities |
US7085832B2 (en) * | 2002-04-30 | 2006-08-01 | International Business Machines Corporation | Method and apparatus for enabling an internet web server to keep an accurate count of page hits |
US6993586B2 (en) | 2002-05-09 | 2006-01-31 | Microsoft Corporation | User intention modeling for web navigation |
US7599911B2 (en) * | 2002-08-05 | 2009-10-06 | Yahoo! Inc. | Method and apparatus for search ranking using human input and automated ranking |
US8375286B2 (en) | 2002-09-19 | 2013-02-12 | Ancestry.com Operations, Inc. | Systems and methods for displaying statistical information on a web page |
US7568148B1 (en) * | 2002-09-20 | 2009-07-28 | Google Inc. | Methods and apparatus for clustering news content |
US20040059625A1 (en) * | 2002-09-20 | 2004-03-25 | Ncr Corporation | Method for providing feedback to advertising on interactive channels |
US7158983B2 (en) * | 2002-09-23 | 2007-01-02 | Battelle Memorial Institute | Text analysis technique |
US20040064447A1 (en) * | 2002-09-27 | 2004-04-01 | Simske Steven J. | System and method for management of synonymic searching |
US6886010B2 (en) * | 2002-09-30 | 2005-04-26 | The United States Of America As Represented By The Secretary Of The Navy | Method for data and text mining and literature-based discovery |
US7130844B2 (en) * | 2002-10-31 | 2006-10-31 | International Business Machines Corporation | System and method for examining, calculating the age of an document collection as a measure of time since creation, visualizing, identifying selectively reference those document collections representing current activity |
US20040098405A1 (en) * | 2002-11-16 | 2004-05-20 | Michael Zrubek | System and Method for Automated Link Analysis |
US7792827B2 (en) * | 2002-12-31 | 2010-09-07 | International Business Machines Corporation | Temporal link analysis of linked entities |
US7016889B2 (en) * | 2003-01-30 | 2006-03-21 | Hewlett-Packard Development Company, Lp. | System and method for identifying useful content in a knowledge repository |
US20040193698A1 (en) * | 2003-03-24 | 2004-09-30 | Sadasivuni Lakshminarayana | Method for finding convergence of ranking of web page |
US20040225644A1 (en) * | 2003-05-09 | 2004-11-11 | International Business Machines Corporation | Method and apparatus for search engine World Wide Web crawling |
US7283997B1 (en) * | 2003-05-14 | 2007-10-16 | Apple Inc. | System and method for ranking the relevance of documents retrieved by a query |
US20040249871A1 (en) * | 2003-05-22 | 2004-12-09 | Mehdi Bazoon | System and method for automatically removing documents from a knowledge repository |
US7146361B2 (en) * | 2003-05-30 | 2006-12-05 | International Business Machines Corporation | System, method and computer program product for performing unstructured information management and automatic text analysis, including a search operator functioning as a Weighted AND (WAND) |
US7685117B2 (en) * | 2003-06-05 | 2010-03-23 | Hayley Logistics Llc | Method for implementing search engine |
US7308643B1 (en) * | 2003-07-03 | 2007-12-11 | Google Inc. | Anchor tag indexing in a web crawler system |
US20050060290A1 (en) * | 2003-09-15 | 2005-03-17 | International Business Machines Corporation | Automatic query routing and rank configuration for search queries in an information retrieval system |
US7739281B2 (en) * | 2003-09-16 | 2010-06-15 | Microsoft Corporation | Systems and methods for ranking documents based upon structurally interrelated information |
US7685296B2 (en) * | 2003-09-25 | 2010-03-23 | Microsoft Corporation | Systems and methods for client-based web crawling |
US7346839B2 (en) | 2003-09-30 | 2008-03-18 | Google Inc. | Information retrieval based on historical data |
US7797316B2 (en) | 2003-09-30 | 2010-09-14 | Google Inc. | Systems and methods for determining document freshness |
US20050102282A1 (en) | 2003-11-07 | 2005-05-12 | Greg Linden | Method for personalized search |
US8631001B2 (en) | 2004-03-31 | 2014-01-14 | Google Inc. | Systems and methods for weighting a search query result |
US20050234877A1 (en) | 2004-04-08 | 2005-10-20 | Yu Philip S | System and method for searching using a temporal dimension |
US7519586B2 (en) * | 2004-04-30 | 2009-04-14 | International Business Machines Corporation | Method of searching |
US20050256848A1 (en) | 2004-05-13 | 2005-11-17 | International Business Machines Corporation | System and method for user rank search |
US7562068B2 (en) | 2004-06-30 | 2009-07-14 | Microsoft Corporation | System and method for ranking search results based on tracked user preferences |
US20060047643A1 (en) | 2004-08-31 | 2006-03-02 | Chirag Chaman | Method and system for a personalized search engine |
WO2006085778A2 (en) | 2005-02-11 | 2006-08-17 | Eurekster, Inc | Information prioritisation system and method |
US20060248055A1 (en) | 2005-04-28 | 2006-11-02 | Microsoft Corporation | Analysis and comparison of portfolios by classification |
US8438142B2 (en) | 2005-05-04 | 2013-05-07 | Google Inc. | Suggesting and refining user input based on original user input |
US7853485B2 (en) | 2005-11-22 | 2010-12-14 | Nec Laboratories America, Inc. | Methods and systems for utilizing content, dynamic patterns, and/or relational information for data analysis |
US9177124B2 (en) * | 2006-03-01 | 2015-11-03 | Oracle International Corporation | Flexible authentication framework |
-
2003
- 2003-12-31 US US10/748,664 patent/US7346839B2/en active Active
-
2004
- 2004-09-15 DE DE200420021885 patent/DE202004021885U1/de not_active Expired - Lifetime
- 2004-09-15 EP EP11186365.0A patent/EP2416263A3/de not_active Withdrawn
- 2004-09-15 JP JP2006533916A patent/JP2007507798A/ja not_active Withdrawn
- 2004-09-15 EP EP11186370.0A patent/EP2416264A3/de not_active Withdrawn
- 2004-09-15 EP EP11186363.5A patent/EP2416262A3/de not_active Withdrawn
- 2004-09-15 CN CN200480033254.8A patent/CN1879107B/zh not_active Expired - Lifetime
- 2004-09-15 EP EP11186372.6A patent/EP2416265A3/de not_active Withdrawn
- 2004-09-15 DE DE200420021886 patent/DE202004021886U1/de not_active Expired - Lifetime
- 2004-09-15 EP EP04784004A patent/EP1668551A1/de not_active Ceased
- 2004-09-15 WO PCT/US2004/030000 patent/WO2005033978A1/en active Application Filing
- 2004-09-15 CA CA2757550A patent/CA2757550A1/en not_active Abandoned
- 2004-09-15 CA CA2540573A patent/CA2540573C/en not_active Expired - Lifetime
- 2004-09-15 AU AU2004277678A patent/AU2004277678C1/en not_active Expired
-
2006
- 2006-11-20 US US11/561,625 patent/US7840572B2/en not_active Expired - Fee Related
- 2006-11-21 US US11/562,285 patent/US8112426B2/en not_active Expired - Lifetime
- 2006-11-22 US US11/562,617 patent/US8051071B2/en active Active
- 2006-11-30 US US11/565,004 patent/US20070094255A1/en not_active Abandoned
- 2006-11-30 US US11/565,026 patent/US8316029B2/en not_active Expired - Lifetime
-
2007
- 2007-01-09 JP JP2007001794A patent/JP4603556B2/ja not_active Expired - Fee Related
-
2010
- 2010-10-01 US US12/896,744 patent/US8407231B2/en not_active Expired - Lifetime
- 2010-10-12 US US12/902,966 patent/US8521749B2/en not_active Expired - Lifetime
-
2011
- 2011-02-10 JP JP2011027886A patent/JP5312498B2/ja not_active Expired - Lifetime
- 2011-06-30 US US13/174,243 patent/US8234273B2/en not_active Expired - Fee Related
- 2011-06-30 US US13/174,304 patent/US8527524B2/en not_active Expired - Lifetime
- 2011-09-14 US US13/232,599 patent/US8549014B2/en not_active Expired - Lifetime
- 2011-09-26 US US13/244,841 patent/US8224827B2/en not_active Expired - Fee Related
- 2011-09-26 US US13/244,867 patent/US8266143B2/en not_active Expired - Fee Related
- 2011-09-26 US US13/244,863 patent/US8185522B2/en not_active Expired - Fee Related
- 2011-09-26 US US13/244,848 patent/US8239378B2/en not_active Expired - Fee Related
- 2011-09-26 US US13/244,853 patent/US8244723B2/en not_active Expired - Fee Related
- 2011-09-30 US US13/250,703 patent/US8577901B2/en not_active Expired - Lifetime
-
2012
- 2012-04-24 US US13/454,424 patent/US8639690B2/en not_active Expired - Lifetime
- 2012-09-14 US US13/615,730 patent/US9767478B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6285999B1 (en) | 1997-01-10 | 2001-09-04 | The Board Of Trustees Of The Leland Stanford Junior University | Method for node ranking in a linked database |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE202004021885U1 (de) | System zur Informationswiedergewinnung basierend auf historischen Daten | |
AU2007200526B2 (en) | Document scoring based on query analysis | |
EP1775666A2 (de) | Auf dem mit einem Dokument verbundenen Verkehr basierender Dokumentähnlichkeitswert |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R152 | Utility model maintained after payment of third maintenance fee after eight years | ||
R207 | Utility model specification |
Effective date: 20120426 |
|
R152 | Utility model maintained after payment of third maintenance fee after eight years |
Effective date: 20120403 |
|
R153 | Extension of term of protection rescinded |
Effective date: 20121011 Effective date: 20120927 |
|
R151 | Utility model maintained after payment of second maintenance fee after six years |
Effective date: 20120905 Effective date: 20120927 Effective date: 20120817 |
|
R152 | Utility model maintained after payment of third maintenance fee after eight years |
Effective date: 20120927 |
|
R071 | Expiry of right | ||
R071 | Expiry of right |