Sammlung von Informationen aus offenen Quellen. Informationsquellen, Methoden zum Suchen und Sammeln von Daten im Internet Nutzung des Internets zum Sammeln von Quellen

EINLEITUNG

Das Internet ist wie eine riesige Weltbibliothek, die nur einen, aber wesentlichen Unterschied hat: Für die Suche nach einem Buch in der Bibliothek gibt es einen Katalog, im Extremfall kann man sich an einen erfahrenen Bibliothekar wenden. Es gibt keinen vollständigen Katalog des Internets. Trotzdem ist die Suche im globalen Computernetzwerk möglich, und dies ist vielleicht einer der wichtigsten Aspekte. Um im Netzwerk nach Daten zu suchen, werden spezielle Server verwendet, deren Informationen nahezu automatisch gepflegt und aktualisiert werden.

Heute, da das Internet zu einer der wichtigsten Informationsquellen geworden ist, gewinnt die Internetsuche immer mehr an praktischem Wert. Nase rapider Anstieg der Menge der verfügbaren Daten wird der Suchvorgang selbst immer komplizierter.

Das Internet ist ein globales Computernetzwerk, das sowohl Computernetzwerkbenutzer als auch PC-Benutzer verbindet. Das Internet wird langsam aber sicher zum wichtigsten Mittel der Unternehmenskommunikation und ist bisher dem Telefon gewichen.

Es gibt eine riesige Menge an Informationsquellen im Web. Schätzungen zufolge hat die Zahl der Dokumente 65 Millionen überschritten und wächst weiterhin schnell. Eine solche Informationsmenge erfordert die richtige Organisation des Suchprozesses und den Einsatz spezieller technischer Mittel, wie z Suchmaschinen... Eine einfache Suche nach einem recht häufigen Schlüsselwort liefert normalerweise Zehntausende bis mehrere Millionen Links. Offensichtlich, mit solchen zu arbeiten große Menge Dokumente sind fast unmöglich, zumal der überwiegende Teil davon Informationen enthält, die für den Fall nicht relevant sind.

Informationsquellen im Internet unterscheiden sich in der Art und Weise, wie Informationen präsentiert werden und folglich auch in der Art des Zugangs zu ihnen.

1 SUCHWERKZEUGE

1.1 Dateisuchwerkzeuge

Das manuelle Auffinden der Datei in der komplexen Verzeichnisstruktur des FTP-Servers kann lange dauern. Um die Suche zu vereinfachen und zu beschleunigen, wurde der Archie Internet Search Service entwickelt, ein spezieller Archie-Server, der den Inhalt von Verzeichnissen anonymer FTP-Server speichert. Bei der Adressierung einer Suchanfrage auf einem Archie-Server ist das Suchergebnis eine Liste von Adressen anonymer FTP-Server, auf denen sich die gewünschte Datei befindet.

Es stellt sich jedoch die Aufgabe, die gewünschte unter den Dateien auf diesem Server zu finden, was aufgrund der unklaren und unverständlichen Namen von Dateien und Verzeichnissen ziemlich schwierig ist. Um dieses Problem zu lösen, wird das Gopher-System verwendet, mit dem Sie durch das System navigieren können Kontextmenüs den Inhalt von Dateien in verständlicher Notation anzeigen. Es gibt viele Gopher-Server, die Datenarchive in Form von hierarchisch strukturierten Verzeichnissen enthalten, die nach Inhalt geordnet sind. Das Arbeiten mit ihnen ist sehr einfach und entspricht dem Arbeiten mit einem normalen Display. Dateisystem.

Es gibt eine Erweiterung dieses Systems - Veronica, die Verzeichnisse aller Gopher-Server in ihrer Datenbank enthält. Nach Eingabe einer Suchabfrage durchsucht Veronica automatisch alle Gopher-Verzeichnisse nach den gesuchten Informationen, wodurch das manuelle Durchsuchen vieler Gopher-Server entfällt.

Mit dieser Navigationsweise war die Gopher gewissermaßen der Vorläufer des WWW. Derzeit nimmt die Nutzung von Gopher proportional zur Zunahme der Nutzung des WWW ab.

1.2 WWW-Tools - WorldWideWeb

1993 wurde das WWW-Informationsabrufsystem entwickelt, das aufgrund seiner einfachen Navigation und Zugänglichkeit Informationsquellen des Internets für unvorbereitete Benutzer öffnete. Das WWW hat einen Internet-Boom ausgelöst, der bis heute anhält, und das Informationsangebot im Internet verdoppelt sich jedes Jahr.

Das WWW basiert auf dem Hypertext-Prinzip (dem Leser bereits bekannt), dh auf einem System von Dokumenten, die durch Hyperlinks verbunden sind. Hypertext ist Stichworte, speziell aus gewöhnlichem Text ausgewählt. Hypertext-Links leiten den Benutzer zu anderen Dokumenten auf demselben Server oder zu anderen Servern, die sich irgendwo im Internet befinden können. Handelt es sich bei diesem Textdokument auch um Hypertext, können Sie über dessen Links weiter zu den entsprechenden Dokumenten gelangen. Jede Umleitung erfolgt für den Benutzer unmerklich, so dass er die Informationsinhalte des Internets sinnvoll einsehen kann, ohne sich Gedanken über die Adressierung bestimmter Rechner machen zu müssen.

Mit der Entwicklung multimedialer Anwendungen werden aus zunächst reinen Hypertextdokumenten zunehmend Hypermedien. Somit können WWW-Dokumente in jedem beliebigen Datenformat vorliegen: Text, Grafik, Ton/Musik oder Videoclip. Die Orientierung und Navigation im World Wide Web erfolgt über spezielle Programme, sogenannte WWW-Browser, die eine Benutzeroberfläche bereitstellen, wie zB NetscapeNavigator oder MicrosoftInternetExplorer.

Ausgangspunkt für die Suche nach Informationen ist in der Regel die Haupt-(Basis-, Homepage-)Seite (Site) der Informationsressource, die durch Eingabe der entsprechenden Adresse im Browser (zum Beispiel http://ncpi .gov.by oder www.iparegistr.com). WWW-Sites werden von Unternehmen oder speziellen Organisationen erstellt und aktualisiert, die Informationen veröffentlichen und den Inhalt ihrer WWW-Seiten überwachen. Die Nutzung des WWW ist daher nicht passiv, und jeder Internetnutzer kann mit Hilfe spezieller Hypertext-Editor-Programme selbstständig seine eigenen interaktiven WWW-Seiten erstellen. Damit war der Weg für die zunehmende Kommerzialisierung und Expansion des Internets geebnet.

Derzeit werden die neu erstellten Informationen in der Regel unter Berücksichtigung der Notwendigkeit eines WWW-Zugangs erstellt und ältere Dokumente werden nach und nach dafür konvertiert, aber weltweit gibt es immer noch Millionen von Dateien in anderer Form als WWW Bedarf. Für die Nutzung dieser Informationen und über das WWW sind die oben genannten Internetdienste in den Browsern enthalten, die den Zugriff darauf ermöglichen (Telnet, FTP, Archie, Gopher). Über das WWW können Sie auch andere Internetdienste nutzen, die zur Kommunikation bestimmt sind (eMail, NetNews). Daher ist der WWW-Browser mittlerweile ein universelles Kommunikationsprogramm für das Internet geworden.

Mit dem Aufkommen des WWW-Dienstes begann der Internet-Boom. Diese einfach zu bedienende, benutzerfreundliche Umgebung für alle Dienste hat das Interesse vieler Menschen und Organisationen im Internet geweckt. Es stellte sich plötzlich heraus, dass man kein Internet-Experte sein musste, um die Dienste des Netzwerks zu nutzen. Dies kann mit dem Erfolg von Microsoft bei der Veröffentlichung von Microsoft Windows als grafische Benutzeroberfläche verglichen werden. Vor dem Erscheinen von Windows hatte jede DOS-Anwendung ihr eigenes Benutzerhandbuch und erforderte daher, dass jede Anwendung separat studiert wurde.

2 GRUNDLEGENDE TECHNIKEN ZUM FINDEN VON INFORMATIONEN IM INTERNET

2.1 Grundvoraussetzungen für die Suche

An die Suchergebnisse werden Anforderungen an die Vollständigkeit der Ressourcenabdeckung, die Verlässlichkeit der gewonnenen Informationen, den minimalen Zeitaufwand und die maximale Suchgeschwindigkeit gestellt.

Die Forderung nach Vollständigkeit der Ressourcenabdeckung bedarf keiner weiteren Erläuterung, mit Ausnahme der Notwendigkeit, Ressourcen nicht nur für das WWW, sondern auch für andere Internetdienste bei der Suche zu verwenden.

Die Verlässlichkeit von Informationen wird angesichts der Beschaffenheit des Internets zu einer äußerst wichtigen Anforderung. Die Bewertung der Zuverlässigkeit kann sowohl mit traditionellen Methoden (Prüfung der Rechtmäßigkeit von Veröffentlichungen auf Papier, Einholung von Informationen über Organisationen und Autoren, Überprüfung der Gültigkeit ihrer elektronischen Ressourcen usw.) mit alternativen Informationsquellen, Abgleich von Faktenmaterial, Ermittlung der Häufigkeit seiner Verwendung durch andere Quellen; Ermitteln des Status des Dokuments und der Bewertung der Quelle durch Suchmaschinen, Einholen von Informationen über die Kompetenz und den Status des Autors des Materials mit speziellen Suchdienste Das Internet; Analyse einzelner Elemente der Standortorganisation, um die Qualifikation der unterstützenden Fachkräfte zu beurteilen und mehr).

Die Suchzeit, die für Verbindungsspezifikationen aufgewendete Zeit nicht mitgezählt, hängt weitgehend von der Suchplanung und den Fähigkeiten des Suchingenieurs mit der Art der Ressource der ausgewählten Ressource ab. Bei der Suchplanung geht es darum, die Suchdienste zu bestimmen, die zum Auflösen einer Suchanfrage erforderlich sind, und die Reihenfolge, in der sie angewendet werden. Darüber hinaus hängt viel von den Fähigkeiten und Erfahrungen des einzelnen Suchspezialisten ab.

Wie bereits erwähnt, stehen Informationen im Internet aus verschiedenen Quellen zur Verfügung. Dies sind in erster Linie WWW-Ressourcen (Hypertextsystem, Ressourcenkataloge, Suchmaschinen). Darüber hinaus sind dem Leser bereits E-Mail, Mail-Roboter, Usenet und andere Newsgroups, sowie FTP-Systeme und Archive (unter Verwendung von Gopher und Veronica) bekannt. WWW ermöglicht die Suche nach den benötigten Ressourcen anhand seiner Hypereigenschaften, d. h. der verfügbaren Suchmaschinen arbeiten mit der Verwendung von Hyperlinks im automatischen Modus, ohne die Möglichkeit der manuellen Anzeige auszuschließen. Das WWW bietet eine Reihe von allgemeinen und spezialisierten Suchdiensten.

Ressourcenverzeichnisse sind Datenbanken mit Internetressourcenadressen und einer Vielzahl von Themen. Sie haben normalerweise eine dem Benutzer vertraute hierarchische Struktur und eine Möglichkeit, diese zu durchsuchen. Meist werden diese Kataloge von Klassifikationsspezialisten betreut, d. h. es ist eine gewisse subjektive Herangehensweise an die Auswahl von Informationen vorgegeben, die einerseits die Verlässlichkeit der Informationen einigermaßen garantiert, andererseits aber die Möglichkeit des Fehlens (Auslassens) einiger Informationen sowie aller verspäteten Platzierung im Verzeichnis.

Suchmaschinen sind ein Mechanismus zum automatischen Erstellen von Links (Indizes) zu verschiedenen Ressourcen. Suchmaschinen können auf globale, spezialisierte oder lokale Ressourcen abzielen. Tatsächlich handelt es sich um leistungsstarke IRS, die mit Hilfe spezieller Roboterprogramme (der sogenannten "Spider") ständig ausgeführt werden automatische Suche erforderliche Informationen im Internet. Auf dieser Basis erstellte spezialisierte Datenbanken ermöglichen eine Informationsabfrage basierend auf Benutzeranfragen basierend auf speziellen IPLs. Die Abdeckung der angezeigten Informationen hängt zwar von den verwendeten Algorithmen ab und lässt selbst für leistungsstarke Suchmaschinen zu wünschen übrig.

Elektronische Post wird im Internet und im WWW verwendet. In diesem Fall gehen die Adressen an Suchmaschinen und stehen Suchmaschinen zur Verfügung.

Mail-Roboter sind spezielle Programme, die in der Lage sind, mit bestimmten Aktionen auf Befehle zu reagieren, die sie erhalten, jedoch per E-Mail. Ihr Hauptzweck besteht darin, Daten auf Abruf zu senden, wenn sie auf andere Weise nicht verfügbar sind, sowie als Alternative zum Online-Arbeiten mit bekannten Ressourcen, beispielsweise FTP-Archiven. Die Adresse des Mail-Roboters liegt im E-Mail-Format vor. Bei der Suche werden Mail-Roboter meist nur als Vermittler bei der Informationsbeschaffung eingesetzt. Manchmal muss man sich damit auseinandersetzen, dass sie das einzige Mittel sind, um an die notwendigen Informationen zu kommen.

Usenet und andere regionale und spezialisierte Newsgroups sind elektronische "Bulletin Boards", in denen der Benutzer seine Informationen in einer der thematischen Newsgroups veröffentlicht, die an Abonnenten des betreffenden Themas übermittelt werden. Diese Ressource ist am wichtigsten für die schnelle Ansammlung von Informationen, aber ein begrenztes Thema, und bei der Suche - häufiger, um private, inoffizielle Informationen zu erhalten.

Die über Telnet verfügbaren Ressourcen stellen teilweise völlig einzigartige Informationen dar, vor allem zu den Bibliothekskatalogen europäischer und amerikanischer Universitäten sowie von Regierungsbehörden.

Wie bereits erwähnt, verfügt das FTP-Dateiarchivsystem über eine ziemlich umfangreiche Ressource an wertvollen Informationen, die noch nicht ins WWW übersetzt wurden. FTP-Archive sind in erster Linie Quellen von Software... Sie zu durchsuchen kann interessant sein, wenn Sie die Struktur der Archive kennen; Erstellen von Dateisystemen, Dateinamen und Verzeichnissen, die die erforderlichen Ressourcen enthalten.

2.2 Methoden zum Auffinden von Informationen im Internet

Sie können im Internet nach den gewünschten Informationen suchen verschiedene Wege:

Suche mit Suchmaschinen nach Stichworten

Suche mit Suchmaschinen-Klassifikatoren

Verzeichnisse und Linksammlungen (allgemeinere Konzepte)

Konferenzen, Chats

· Seiten mit Links ("Links") zu thematischen Sites (seltene, spezialisierte Artikel)

Non-Network-Methoden (Beratung durch Freunde, Bekannte; Werbung in Printmedien)

Zu Beginn der Suche nach Informationen ist es notwendig, deren Typ zu bestimmen. Herkömmlicherweise können 4 Arten von Informationen unterschieden werden.

1 Typ - allgemein (zum Beispiel: Geschichte des Russischen Reiches),

Typ 2 - weniger allgemein (zum Beispiel: Kaiser Alexander II.),

Typ 3 - spezifisch (zum Beispiel: die Reformen von Alexander II.),

Typ 4 ist spezifischer (zum Beispiel: die Abschaffung der Leibeigenschaft).

Suchpfade werden auch abhängig von der Art der Information bestimmt.

Informationen vom Typ 1 werden mithilfe von Suchmaschinen-Klassifikatoren gesucht (aus dem Russischen - Yandex www.Yandex.ru wird empfohlen). Wenn die Sites mit den erforderlichen Informationen nicht sofort gefunden werden, sollten Sie die vom Klassifikator gefundenen Kataloge und Seiten mit Links ("Links") durchsuchen, die sich auf Sites zu einem ähnlichen Thema befinden. Diese Sites werden im Klassifikator nach Themen und gefundenen Verzeichnissen aufgelistet.

Informationen vom Typ 2 werden ähnlich wie die Suche vom Typ 1 durchsucht, jedoch mit dem Vorteil, dass Verzeichnisse und Linkseiten durchsucht werden können.

Informationen von 3 Arten - nach Schlüsselwörtern, die in die Suchleiste von Suchmaschinen, Katalogen, Linkseiten eingegeben werden

Informationen von 4 Arten - entsprechend den detaillierten Daten, die in die Suchleiste eingegeben werden. Die Daten werden nach den für Typ 2 und 3 beschriebenen Suchmethoden gefunden.

Suche nach Typ 1. Erforderliche Informationen: "Geschichte des Russischen Reiches".

Wir gehen zu Yandex - Wissenschaft und Bildung / Sozialwissenschaften / Geschichte. Gemäß der Beschreibung des Themas finden wir die Site http://rus-hist.on.ufanet.ru .. Wenn sie nicht die erforderlichen Informationen enthält, gehen Sie zur Linkseite dieser Site. Es enthält Links zu Ressourcenkatalogen: www.history.ru, http://www.lants.tellur.ru/history/index.htm. In ihnen werden höchstwahrscheinlich Websites zu einem bestimmten Thema gefunden.

Suche nach Typ 2. Erforderliche Angaben: "Kaiser Alexander II".

Die Suche wird ähnlich wie die vorherige durchgeführt, jedoch wird der Arbeit mit Katalogen mehr Aufmerksamkeit geschenkt www.history.ru, http://www.lants.tellur.ru/history/index.htm.

Suche nach Typ 3. Pflichtangaben: "Reformen Alexanders II."

Hier erscheint neuer Weg suchen - nach Schlüsselwörtern. Wir schreiben in die Suchzeile von Yandex "Reforms of Alexander II". Ergebnis zum Anzeigen - 1790 Seiten, die sich auf 170 Sites befinden, die Verzeichnisse enthalten. Um die Informationen einzugrenzen, können Sie neue Schlagworte hinzufügen - zusätzliche Fakten in der bereits gefundenen Auswahl an Sites, zum Beispiel: "1860-1870". etc. In anderen Suchmaschinen wird die gesamte "Reform Alexanders II. 1860-1870" eingetippt. Um nach den angegebenen Informationen zu suchen, können Sie auch die "Links" verwenden, die auf den gefundenen Seiten angegeben sind

2.3 Entwicklung einer Informationsressource

Wie andere Informationstechnologien wird das Internet von Entwicklern geschaffen, aber in diesem Fall sind es hauptsächlich die Schöpfer von Ressourcen (ausgehend von Spezialisten, die Hard- und Software unterstützen, Designern, Künstlern, Redakteuren und vor allem den Autoren von Informationsressourcen). . Natürlich ist die Schaffung von Ressourcen kein Selbstzweck, Ressourcen werden von Netzwerkbenutzern nachgefragt, dh von denselben Spezialisten und Ressourcenverbrauchern, unter denen, wie bereits erwähnt, eine neue Schicht auftaucht - Spezialisten für Datamining, für Informationen Suche. Informationsressourcen des Internets sowie anderer, einschließlich nicht-elektronischer Informationsressourcen (insbesondere der Massenmedien), zeichnen sich durch bestimmte Zustände ihrer Aktivitäten aus (Abb. 9.3).

Die Ressource entsteht in Übereinstimmung mit den Bedürfnissen der Gesellschaft und ihren Fähigkeiten (insbesondere denen, die sich auf das Niveau des technischen und sozialen Zustands der Gesellschaft beziehen).

Soweit möglich gibt es eine "Reifung", die Bildung der Ressource (oder ihr Verschwinden bei fehlender Nachfrage, also Verschwinden, vielleicht nicht im physischen Sinne - der Ort kann existieren, nämlich im Sinne des Seins gefragt).

Ab einer bestimmten Nachfrage und (einschließlich der Bemühungen der Autoren der Site) wird sie katalogisiert, dh Informationen über die Ressource erscheinen in verschiedenen Verzeichnissen, die der Art der Ressource entsprechen.

Die Indexierung, also das Erscheinen einer Ressource in den Indizes von Suchmaschinen, erfolgt, wenn ein bestimmter Informationsgehalt und Bedarf erreicht wird.

Bei stetig steigender Nachfrage entwickelt sich die Ressource ständig weiter, ansonsten stirbt die Ressource aus und verschwindet nach und nach aus den Verzeichnissen und Katalogen.

2.4 Anforderungen an Suchtools

Wie bereits erwähnt, sind die inhärenten Merkmale einer professionellen Suche ihre Vollständigkeit, Zuverlässigkeit und hohe Geschwindigkeit. Der gravierendste und nicht trivialste Faktor, der die Geschwindigkeit des Erreichens des Suchziels bestimmt, ist die Planung des Suchverfahrens. Dies erfordert zum einen die Wahl der Art der Ressourcen, die potentiell in der Lage sind, für die Suchaufgabe relevante Informationen zu transportieren, zum anderen die Auswahl der Suchwerkzeuge, die das entsprechende Informationsfeld bedienen, abhängig von ihrer erwarteten Leistung . Wenn wir von dem für heute umfangreichsten Informationsinhalt sprechen, dem WWW-Raum, dann macht die relative Fülle seiner Suchmöglichkeiten die Lösung der meisten praktischen Probleme multivariat. Die Konstruktion der optimalen Reihenfolge für die Verwendung bestimmter Tools in jeder Phase der Suche und legt ihre Wirksamkeit vor. Eine klare Vorstellung von Art, Zweck und Merkmalen der Arbeit von Information-Retrieval-Systemen (ISS) des Internets kann helfen, das Problem der Wahl zu lösen.

Suchmaschinen und Kataloge sind echte Informationsträger über die Ressourcen des Internets. Informationsabrufsysteme des Internets unterscheiden sich, aber das Prinzip der Auswahl von Informationen, die in gewissem Maße im Scanprogramm der Suchmaschine vorhanden sind, und in den Aktivitäten von Spezialisten, die die Katalogisierung durchführen. In der Regel werden zwei Hauptindikatoren unterschieden: der räumliche Maßstab des Systems und seine Spezialisierung.

Beim Bilden des Informationsarrays kann die Suchmaschine die Aktualisierung eines vorbestimmten Satzes von Dokumenten, Katalogen oder einer endlichen Anzahl von Knoten, die nach einem bestimmten Prinzip ausgewählt werden, verfolgen. Solche im Internet implementierten Systeme können etwas bedingt als lokal und bezeichnet werden. Globale Suchmaschinen lösen im Gegensatz zu lokalen Suchmaschinen eine mühsamere Aufgabe - die möglichst vollständige Abdeckung der Ressourcen des gesamten Informationsfeldes des Internets (WWW oder anderes), das sie bedienen. Die Folge davon ist die zunehmende Rolle des Mechanismus, der von einem solchen System verwendet wird, um die Anzahl der angesehenen Sites ständig zu erhöhen.

Der Aufbau regionaler und spezialisierter Suchdienste setzt eine aktive Filterung von Informationen voraus. Die Spezialisierung einer Suchmaschine auf Basis eines beliebigen Profils ODER Themas, sei es ein juristischer Schwerpunkt, die Suche nach Persönlichkeiten oder Multimediadateien im MP3-Format, kann sowohl global als auch lokal erfolgen. Natürlich ist das System auf dem begrenzten Raum aktualisierter Sites, der normalerweise in der Praxis implementiert wird, einfacher aufzubauen und zu warten.

Regionale Suchdienste filtern Informationen hauptsächlich nach dem Domänennamen der obersten Ebene des Servers, zum Beispiel nach Weißrussland, ru - für Russland. Ein schwerwiegender Nachteil solcher Systeme ist, dass eine große Anzahl von Ressourcen, die von regionalen Ressourcenautoren direkt in der com-Domäne veröffentlicht werden, nicht berücksichtigt werden.

Die Berücksichtigung regionaler Besonderheiten ist bei globalen Suchdiensten häufig vorhanden. Das Lycos-System beispielsweise ordnet Antworten nach Anfrageregionen.

Das Internet ist naturgemäß von einem Informationschaos begleitet. Und nur moderne Mittel der automatischen Indexierung von Dokumenten sind in der Lage, unter Berücksichtigung der verwendeten Algorithmen und der Möglichkeiten technischer Mittel, in diesem Chaos eine rationale Körnung zu finden. Der Ressourcenverbrauch bei der Ressourcensuche ohne Stichwortsuche erinnert an Surfen und nicht an ernsthafte Arbeit mit Informationen.

2.6 Globale WWW-Suchmaschinen

Nach dem Kennenlernen mehrerer globaler Suchmaschinen bleibt der Nutzer in der Regel bei ein oder zwei stehen, mit denen er zukünftig am liebsten arbeitet. Gleichzeitig erfolgt die Wahl eines Suchdienstes oft völlig willkürlich, nicht nach der Analyse der tatsächlichen Fähigkeiten der Systeme, sondern nach ihrer Popularität. Einer der größten und beliebtesten ist AltaVista. Das AltaVista-System verfügt über eine flexible Abfragesprache, die jedoch ein spezielles Studium erfordert. AltaVista bietet mehrsprachige Unterstützung für den Suchindex und die Möglichkeit, den Text einer Webseite online (dh direkt während einer Sitzung) aus den gängigen europäischen Sprachen ins Englische zu übersetzen.

Ein weiteres bekanntes System ist NorthernLight, das über einen ziemlich standardmäßigen Funktionsumfang verfügt. Das System ermöglicht außerdem die Arbeit mit einer einzigartigen Linksammlung (mehr als 6 Tausend), hauptsächlich zu Artikeln aus Zeitschriften. Die Indexunterstützung des kyrillischen Alphabets (einschließlich der russischen Sprache) macht es zusammen mit AltaVista zu einer guten Ergänzung der regionalen russischen Suchmaschinen Rambler, Yndex und Aport für die russischsprachige Suche.

Das Auffinden und Sammeln von Informationen im Internet erfordert Planung. Fehlerhafte Logik beim Erstellen einer Abfrage, nicht optimierte Reihenfolge der Verwendung von Suchwerkzeugen, Versuche, die Suche zu beschleunigen - all dies verzögert nicht nur das Ergebnis, sondern kann den Sinn der Sucharbeit gefährden.

Lassen Sie uns auf einige wichtige Punkte im Zusammenhang mit der Planung und den ersten Schritten einer solchen Arbeit eingehen.

Es ist notwendig, mit einer umfassenden lexikalischen Analyse der benötigten Informationen zu beginnen. Jede hinreichend zuverlässige und detaillierte Beschreibung des untersuchten Problems sollte verwendet werden, um Primärinformationen zu erhalten. Eine solche Quelle kann sowohl ein hochspezialisiertes Nachschlagewerk als auch eine elektronische Enzyklopädie mit allgemeinem Profil sein. Auf der Grundlage des erlernten Materials ist es erforderlich, ein möglichst breites Set an Schlagworten in Form von Einzelbegriffen, Wendungen, Fachvokabular, Slang, Klischeewörtern und stabilen Wortmarken, ggf. in mehreren Sprachen, zu bilden. Mögliche Verfeinerungen der Suchanfrage sollten vorab festgelegt werden – seltene Wörter, Synonyme und Antonyme. Vor- und Nachnamen, die in engem Zusammenhang mit der gewünschten Frage stehen. Es ist auch wünschenswert, mögliche irrelevante Antworten auf Anfragen, d. h. mögliche Eigenschaften des Suchrauschens, im Voraus zu antizipieren. Nachdem Sie diese vorläufigen Daten gesammelt haben, können Sie mit dem Abrufen von Primärinformationen aus dem Internet fortfahren.

Die Hauptaufgabe dieser Stufe besteht darin, die Besonderheiten des Internets zu berücksichtigen, das nicht nur Technologieträger ist, sondern auch Traditionen und eine eigene Ethik. Netzwerkvokabular, Slang und die Schreibweise gebräuchlicher Wörter können hier von den akzeptierten abweichen.

Informationen über die Verfügbarkeit der benötigten Daten im Internet suchen Sie am besten in einem bereits bekannten Verzeichnis, das Stichwortsuche unterstützt. Bei der Lösung beispielsweise einfacher Aufgaben wie "Besorgen Sie sich den Text der Verfassung der Republik Belarus" oder "In welchen Rechtsakten wird der Name der Heimatstadt verwendet?" der schnelle Weg Informationen zu erhalten als ein automatischer Index, und bietet eine größere Zuverlässigkeit.

Nach der lexikalischen Analyse der Informationen beginnt die technologische Phase. Die Wahl des Informationsfeldes des Internets und der Suchwerkzeuge basiert auf den obigen Ansätzen.

Testabfragen von einem oder zwei Schlüsselwörtern oder Phrasen werden verwendet, dann wird die quantitative Antwort analysiert. Die Inhaltsanalyse der Daten ermöglicht es Ihnen, die Abfragen, aber die Relevanz der Antwort anzupassen. Als Ergebnis der Tests werden die repräsentativsten Informationsquellen identifiziert, wonach die Reihenfolge der Verwendung von Suchwerkzeugen geklärt werden sollte. Damit ist die Planungsphase abgeschlossen.

Zusammenfassend stellen wir fest, dass bei der Lösung des Problems der Informationssammlung aus dem Internet regionale und spezialisierte Suchdienste eine wichtige Rolle spielen. Die Verwendung globaler Indizes nicht für die direkte Suche nach den notwendigen Informationen, sondern für die Lokalisierung dieser Suchwerkzeuge ermöglicht es oft, die zur Lösung eines bestimmten Suchproblems erforderliche Zeit zu verkürzen.

FAZIT

Unter Berücksichtigung all dessen können wir versuchen, die Essenz des Internets in einem Wort zu definieren: Es ist die Kommunikation, die Kommunikation zwischen Einzelpersonen und ganzen Nationen ohne das Eingreifen staatlicher Behörden. Diese neue Technologie verändert das Gesicht der Zivilisation mit enormer Geschwindigkeit und verändert die Vorstellung der Menschheit über die Welt und sich selbst grundlegend. Das Internet hat bereits zig Millionen Menschen in mehr als hundert Ländern absorbiert, es hat die Prozesse der Verbreitung und Wahrnehmung von Informationen vollständig verändert. In unserem Jahrhundert Informationstechnologien Virtual-Reality-Internet, Beitrag zur Auslöschung von Staatsgrenzen, Verringerung geographischer Distanzen, Abbau von Barrieren zwischen den Kulturen , wird nicht weniger offensichtlich als die materielle Welt um uns herum.

Mit der Entwicklung von INTERNET wurde es möglich, schnell und bequem nach den notwendigen dokumentarischen Informationen zu suchen. Jetzt müssen Sie sich nicht mehr mit der Auswahl und dem Studium einer großen Menge an Literatur in Buchhandlungen und Bibliotheken beschäftigen. Informationen können abgerufen werden, ohne Ihr Zuhause oder Büro zu verlassen. Dazu benötigen Sie nur einen Computer, der direkt mit dem INTERNET verbunden ist und auf dem ein spezielles Programm installiert ist - ein Browser, der den Inhalt von Webseiten anzeigen kann.

Dank der Vielfalt an Suchmaschinen, die speziell auf den Durchschnittsnutzer ausgelegt sind, kann jeder den offensichtlich unnötigen Informationsfluss nur durch die richtige Formulierung des Suchzwecks leicht abschneiden.

LISTE DER VERWENDETEN LITERATUR

1. Grinberg A.S., Kashinsky Yu.I., Slavin B.S. Einführung in die Rechtsinformatik. Minsk: NO OOO BIP-S, 2002.S. 303.

2. Gusev V.S. Google: Effektiv suchen. Schnellstartanleitung. M., 2006.

3. Informatik für Juristen und Ökonomen / Herausgegeben von S. V. Simonovich. SPb.: Peter, 2001.

4. Informatik. Grundkurs. Lehrbuch für Universitäten, St. Petersburg, 2001

5. Computertechnologien im juristischen Bereich / Herausgegeben von Professor N. Polevoy. M.: Verlag BEK, 1994.

6. Essiggurken M.M. Informationsrecht. - M.M.: Jurist, 1999.-321s.

7. Enzyklopädie des Internets, St. Petersburg, 2001

8. Vergleich der Browser // http: //www.microsoft.com

Die verwendeten Datenerhebungsmethoden unterscheiden sich je nach Art der durchgeführten Forschung – primär oder sekundär.

Bei der sekundären Marktforschung stehen Methoden der Internetrecherche nach den notwendigen Informationen im Vordergrund. Die wichtigsten Werkzeuge, um es heute zu finden, sind Suchmaschinen und Kataloge. In einer Reihe von Fällen, in denen ihre Verwendung keine ausreichende Wirkung zeigt, wird eine "manuelle" Suche auf thematischen Websites, "Gelben Seiten" und einer Reihe anderer Ressourcen verwendet. Suchmethoden werden in einem späteren Abschnitt dieses Kapitels ausführlicher behandelt.

Bei der Erhebung von Primärinformationen sind die wichtigsten Methoden der Datenerhebung Internet-Umfragen, Beobachtungen und Experimente.

Internetumfragen - die am weitesten verbreitete Methode zur Durchführung ist eine Fragebogenerhebung. Der Fragebogen ist ein Fragenkatalog, auf den die Antworten der Befragten, also der für den Fragebogen ausgewählten Personen, eingehen müssen. Da dieses Tool sehr flexibel und vielseitig ist, ist es das gebräuchlichste Mittel zum Sammeln von Primärdaten;

In Abb. 3 zeigt ein Fragment des Fragebogens, der aufgefordert wird, Benutzer auszufüllen, die sich für die Verwendung entschieden haben kostenloser Service E-Mail auf der Website

Reis. 3.

Wie bei herkömmlichen Fragebögen ist es vor jeder Internetrecherche notwendig, die darin verwendeten Fragebögen sorgfältig zu entwickeln und zu testen. Eine unprofessionelle Vorgehensweise bei deren Zusammenstellung führt unweigerlich zu einer Verzerrung des realen Bildes oder die erhaltenen Ergebnisse lassen sich nicht sinnvoll interpretieren.

Diese Art von Forschung ist einem der weiteren Abschnitte dieses Kapitels mit dem Titel "Durchführung von Internet-Umfragen" gewidmet.

Beobachtung ist eine Form der Marktforschung, mit deren Hilfe eine systematische, systematische Untersuchung des Verhaltens eines Objekts oder Subjekts durchgeführt wird. Im Gegensatz zu Polling hängt die Beobachtung nicht von der Bereitschaft des beobachteten Objekts ab, Informationen zu übermitteln, und ist ein Prozess der offenen oder versteckten Sammlung und Registrierung von Ereignissen oder besonderen Momenten, die mit seinem Verhalten verbunden sind. Beobachtungsobjekte können beispielsweise Eigenschaften und Verhalten von Käufern sein;

Diese Methode beinhaltet Marktforschung, die von Firmen mit eigenem Webserver durchgeführt wird. Sie bestehen in der Erhebung und anschließenden Analyse von Daten, die aus den Protokolldateien des Webservers oder durch den Einsatz von Technologien gewonnen werden, die Kekse... Diese Daten können sich auf das Verhalten der Besucher, die Reihenfolge ihrer Übergänge auf den Seiten oder Statistiken über die Besuche des Webservers beziehen. Wird eine Suchmaschine auf der Website eingestellt, können zusätzlich von Nutzern eingegebene Anfragen gesammelt und analysiert werden.

Die Möglichkeit, Statistiken über Serverbesuche zu analysieren, ist eines der effektivsten Marketinginstrumente. Im Gegensatz zu Umfragen, die die aktive Teilnahme der Befragten erfordern, können Sie durch die Analyse von Statistiken wertvolle Informationen sammeln, ohne die Besucher zum Handeln zu bewegen.

Experiment - Aus wissenschaftlicher Sicht ist die rigoroseste experimentelle Studie, die darauf abzielt, Ursache-Wirkungs-Beziehungen herzustellen. Versuchspersonen sollten speziell ausgewählt und planmäßigen Einflüssen in den Bedingungen der Kontrolle über die äußere Umgebung ausgesetzt werden, um statistisch signifikante Unterschiede in ihren Reaktionen aufzudecken. Soweit es den Forschern gelingt, irrelevante externe Faktoren „abzuschneiden“ oder zu kontrollieren, können die beobachteten Effekte mit den Wirkungen der Experimentatoren auf das Objekt korreliert werden. Die auf diese Weise hergestellten Zusammenhänge zwischen Ereignissen nach ihrer kritischen Analyse können als kausal angesehen werden, und die Ziele des Experiments - erreicht.

Wenn wir die benötigten Informationen im Internet finden müssen, haben wir mehrere Möglichkeiten, um das zu erreichen, was wir wollen. Die meisten Leute verwenden Suchmaschinen, geben die erforderliche Abfrage ein und studieren die bereitgestellten Suchergebnisse. Für bestimmte Zwecke kann auf den Einsatz spezialisierter Datenbanken (DB) oder Verzeichnisseiten nicht verzichtet werden.

Wie Sie nach den benötigten Informationen suchen, hängt nur von Ihrem Wunsch ab und bestimmt, wie viele Informationen Sie verarbeiten müssen, bevor Sie das Gesuchte finden, und wie lange es dauert.

Betrachten wir kurz einige Suchmethoden:

1. Wenn Sie sich entscheiden, eine Suchmaschine zu verwenden, um allgemeine Informationen über etwas zu erhalten, dann sollten Sie die Ergebnisse von Millionen von Seiten und zahlreichen Klicks auf Links nicht erschrecken. Wenn Ihr Ziel jedoch darin besteht, bestimmte Informationen zu finden, können Probleme auftreten. Diese Methode garantiert nicht die Richtigkeit der Informationen und ist zeitaufwändig.

Auf der anderen Seite ermöglichen Ihnen die meisten Suchmaschinen, wie Yandex und Google, Ihre Suche einzugrenzen. Zunächst können Sie die erweiterten Suchfilter verwenden. Mit Hilfe dieser Filter können Sie die gewünschte Region auswählen, Suchergebnisse auf das Datum der Dokumentenaktualisierung beschränken, die Dokumentensprache definieren und vieles mehr. Zweitens gibt es im gleichen Yandex eine "Abfragesprache". Das Wesentliche besteht darin, dass Sie zum Einschränken des Suchbereichs spezielle Operatoren verwenden können, die Ihnen Folgendes ermöglichen:

Erhalten Sie in den Suchergebnissen nur Dokumente, die das angeforderte Wort in der angegebenen Form enthalten

Klären Sie das Vorhandensein und die relative Position der angeforderten Wörter im Dokument

Suche nach Dateityp, Host usw. einschränken.

2. Wenn Sie Informationen zu einem bestimmten Thema suchen, reicht eine Verzeichnissuche. Auf solchen Seiten werden die Informationen systematisiert und strukturiert, nach Themen und Unterthemen gegliedert, was das Auffinden des gewünschten Abschnitts erleichtert. Diese Seiten werden von echten Menschen bearbeitet, daher kann man den dort bereitgestellten Links meistens vertrauen. Natürlich ist diese Suchmethode nicht sehr effektiv, wenn Sie ein bestimmtes Dokument finden müssen, aber sie funktioniert gut, wenn Sie so viele Informationen wie möglich zu einem breiten Thema finden müssen.

Es gibt eine große Anzahl von Verzeichnissen im Internet, sowohl spezialisiert, einem breiten Thema gewidmet als auch multidisziplinär.

Betrachten Sie als Beispiel zwei große, multidisziplinäre Kataloge. DMOZ ist eines der größten Ressourcenverzeichnisse im Internet. Betrachten wir rein russischsprachige Verzeichnisse, können wir list.mail.ru herausgreifen. Im Folgenden werden wir Ihnen ein wenig mehr über diese Ressourcen erzählen.

3. Die Datenbanksuche ist effektiv für thematische Suchen. Das Zusammentragen der benötigten Informationen in fremd- und russischsprachigen Informations-, Bildungs- und Wissenschaftsressourcen erfordert sehr oft einen hohen Aufwand und kann einen erheblichen Geld- und Zeitaufwand kosten.

Es gibt eine Vielzahl von Datenbanken im Web - sachlich, bibliografisch, Volltext, objektografisch usw., die je nach Inhalt der darin gespeicherten Informationen in universelle, branchenspezifische und thematische Datenbanken unterteilt werden können. Bibliografische Datenbanken sind beispielsweise von Natur aus elektronische Gegenstücke zu herkömmlichen gedruckten bibliografischen Veröffentlichungen. Bibliographische Datenbanken unterstützen in der Regel einen einmal festgelegten, übersichtlichen Algorithmus zur Beschreibung von Dokumenten nach bestimmten Kriterien. Dies hilft, die notwendigen Informationen zu finden, insbesondere wenn es darum geht, eine bestimmte Veröffentlichung in einer Zeitschrift zu finden.


Beispiel. Verzeichnisse.

Ein Verzeichnis von Internet-Sites oder ein Verzeichnis von Internet-Ressourcen oder einfach ein Internet-Verzeichnis (englisches Webverzeichnis) ist ein strukturierter Satz von Links zu Sites mit einer kurzen Beschreibung derselben. Sites innerhalb des Verzeichnisses sind nach Themen gegliedert.

1. OpenDirectoryProject (ODP, Open Directory (ODP)), auch bekannt als DMOZ (von einem seiner ersten Domänennamen directory.mozilla.org) - mehrsprachiges kostenloses Verzeichnis mit Links zu Websites weltweites Netz betrieben von einer Online-Community freiwilliger Redakteure.

Auf der dieser Moment Auf der Website finden Sie:

3.884.779 Seiten

Informationen sind in 90 Sprachen verfügbar, darunter Russisch, Deutsch, Englisch, Griechisch, Französisch, Japanisch, Koreanisch, Italienisch usw.

Die Site hat 91.790 Redakteure.

Die Hauptkategorien sind: Kunst, Wirtschaft, Computer, Spiele, Gesundheit, Zuhause, Nachrichten, Freizeit, Fachbücher, Regionen, Wissenschaft, Shopping, Gesellschaft, Sport, Katalog für Kinder und Jugendliche. Jede dieser Hauptkategorien ist in eine Vielzahl von Unterthemen unterteilt.

DMOZ wird von AOL Inc. betrieben. (ein amerikanisches Medienkonglomerat, Anbieter von Online-Diensten und Message Boards). Die Governance wird von einem kleinen Team von Fachleuten übernommen, die für redaktionelle Richtlinien und Führung, Community-Governance und -Entwicklung sowie Systems Engineering verantwortlich sind.

DMOZ ist jedoch in erster Linie eine selbstregulierende Gemeinschaft. Durch ein selbstverwaltetes System verwalten freiwillige Redakteure das Verzeichniswachstum und die Entwicklung, während Checks and Balances qualitativ hochwertige Inhalte sicherstellen.

DMOZ ist eine Open-Source-Freiwilligeninitiative. AOL Inc. Verwaltet es eher wie eine Non-Profit-Organisation und versucht, seine Atmosphäre offener und freier Ressourcen zu bewahren.

2. Wenn wir über russischsprachige Kataloge sprechen, können wir [email protected] hervorheben. Analog zu DMOZ gibt es hier Hauptthemen, die dann in kleinere zerlegt werden. Es gibt insgesamt 18 Hauptkategorien: Autos, Internet, Medizin und Gesundheit, Nachrichten und Medien, Produktion, Wirtschaft und Finanzen, Computer, Wissenschaft und Bildung, Sport und so weiter.

Zur Vereinfachung der Benutzer können Sie in jedem Abschnitt eine Aufschlüsselung aller zu diesem Thema verfügbaren Links nach folgenden Punkten anzeigen:

Arten von Sites (Informations-, Unternehmens-, Privat-, Service-Sites, Privat, Informationsdienst)

Sie können die Suchergebnisse auch alphabetisch, nach Datum und Beliebtheit sortieren.

Jeden Tag bietet [email protected] die am häufigsten besuchten Sites des Tages aus den im Katalog verfügbaren Sites.


Beispiel. Datenbank.

Espacenet (früher oft bezeichnet als [E-Mail geschützt]) es ist kostenlos Onlineservice um nach Patenten und Patentanmeldungen zu suchen. Espacenet wird vom Europäischen Patentamt (EPA) in Zusammenarbeit mit den Mitgliedsstaaten der Europäischen Patentorganisation entwickelt. Die meisten Mitgliedstaaten können Espacenet in ihrer Landessprache nutzen und haben Zugang zur weltweiten Datenbank des EPA, von denen die meisten auf Englische Sprache... Im Jahr 2015 behauptete Espacenet, Aufzeichnungen von über 90 Millionen Patentveröffentlichungen registriert zu haben.

Das Espacenet-Projekt wurde zum ersten Mal 1998 ins Leben gerufen und revolutionierte internationale Patentinformationen, indem es der Öffentlichkeit zugänglich gemacht wurde, und veränderte damit für immer die Art und Weise, wie Patente verteilt, geprüft und recherchiert werden.

Im Jahr 2012 startete das EPA das Projekt PatentTranslate, einen kostenlosen Online-Dienst für die automatische Übersetzung von Patenten. Der Dienst wurde in Zusammenarbeit mit Google entwickelt und "zweckgerichtet, um komplexes Patentvokabular zu handhaben". PatentTranslate umfasst 31 Sprachen.

Seit März 2016 bietet Espacenet eine Volltextsuche in einer Datenbank mit englischen, französischen und deutschen Patentdokumenten an.

Beispiel. Suchmaschine.

Die Suchmaschine ist Computersystem, entworfen, um nach Informationen zu suchen. Eine der bekanntesten Anwendungen von Suchmaschinen sind Webdienste zum Auffinden von Text- oder Grafikinformationen im World Wide Web.

Um mit einer Suchmaschine nach Informationen zu suchen, formuliert der Benutzer eine Suchanfrage. Die Aufgabe einer Suchmaschine besteht darin, auf Anfrage des Benutzers Dokumente zu finden, die entweder die angegebenen Schlüsselwörter oder Wörter enthalten, die in irgendeiner Weise mit den Schlüsselwörtern in Zusammenhang stehen.

Die Suchmaschinenarchitektur umfasst typischerweise:

Suchroboter Sammeln von Informationen von Internetseiten oder aus anderen Dokumenten,

Indexer bereitstellen schnelle Suche nach den gesammelten Informationen, und

Suchmaschine ist eine grafische Oberfläche für die Benutzerarbeit.

Im Moment haben Benutzer eine große Auswahl, welche Art von Suchmaschine sie verwenden möchten, um die benötigten Informationen zu finden: Google, Bing, Yahoo!, Yandex, Rambler und so weiter.

Nehmen wir als Beispiel die Suchmaschine Bing. Bing ist ein relativ junger Suchdienst, der erstmals 2009 seine Existenz angekündigt und von Microsoft-CEO Steve Ballmer eingeführt wurde. Trotz ihrer Jugend ist diese Suchmaschine jedoch in einigen europäischen Ländern sowie in Nordamerika bereits nach dem Suchriesen Google an zweiter Stelle.

Bing ist in Ländern wie den USA, China, Deutschland, Indien und Großbritannien am beliebtesten.

Die Suchmaschine hat ein lakonisches das Auftreten, und um Informationen zu finden, können Sie auch die Kategorien "Bilder", "Videos", "Karten", "News" verwenden. Darüber hinaus verfügt Bing über einen eigenen Übersetzer auf Basis von MicrosoftTranslator. Zu den Besonderheiten dieser Suchmaschine gehört die Tatsache, dass Sie direkt in der Suchmaschine, ohne Installation auf einem Computer, lizenzierte Microsoft Office-Produkte verwenden können.

Wenn Sie diese Site als Informationsquelle bewerten, stoßen Sie möglicherweise auf eine Funktion, die eine schnelle und genaue Suche erschwert. Besonderheit Suchalgorithmus Bing ist seine Beziehung zur Keyword-Dichte. Wenn Site-Texte für eine erfolgreiche Werbung in anderen Suchmaschinen zwischen 5 und 8 % Keywords enthalten müssen, geht Bing von einer natürlichen Keyword-Dichte von 3 % aus. Dadurch steigt die Wahrscheinlichkeit, dass Ihrer Anfrage Links zu Websites bereitgestellt werden, die nicht die erforderlichen Informationen enthalten.

Wie seine Konkurrenten hat Bing die Möglichkeit, Suchergebnisse nach Zeitraum, Sprache und Region zu filtern.


FAZIT

Das Internet bildet ein gigantisches Datenarchiv zu allen Bereichen des menschlichen Wissens. Virtuelle Bibliotheken, Archive, Newsfeeds enthalten eine Unmenge an Text-, Grafik-, Audio- und Videodateien – das weltweite Computernetzwerk bietet uns eine Unmenge offener Informationen. Und in diesem Informationsfluss zu navigieren und zu finden, was Sie brauchen, ist für einen Menschen des 21. Jahrhunderts sehr wichtig.

Wir haben an konkreten Beispielen solche offenen Informationsquellen im Internet wie Kataloge, Datenbanken und Suchmaschinen kennengelernt und untersucht, wie im Rahmen dieser Ressourcen nach Informationen gesucht wird.

Quellen von

1) Artikel „Sammeln von Informationen aus offenen Quellen“ [Elektronische Ressource] // Vsepoisk, 2015, URL: http://www.vsepoisk.ru/2009/03/blog-post_27.html (Zugriffsdatum: 13.12.2016)

2) Offizielle Website von DMOZ [Elektronische Ressource] // DMOZ, 2016, URL: http://www.dmoz.org/ (Zugriffsdatum: 13.12.2016)

3) Offizieller Site Catalog @ Mail [Elektronische Ressource] // Mail.ru, 2016, URL: http://list.mail.ru/ (Datum des Zugriffs: 13.12.2016)

4) Die offizielle Website von Espacenet [Elektronische Ressource] // Espacenet, 2015 URL: http://www.epo.org/index.html (Zugriffsdatum: 13.12.2016)

5) Der Artikel "Wir suchen in Datenbanken" [Elektronische Ressource] // Vsepoisk, 2015, URL: http://www.vsepoisk.ru/2009/04/blog-post_08.html (Zugriffsdatum: 13.12.2016 )

2. Registrierung der Datenbank

Bevor Sie irgendwelche Operationen mit der IBExpert-Anwendung durchführen vorhandene Basis Daten es muss registriert werden. Verwenden Sie dazu entweder den Menübefehl "Datenbank > Datenbank registrieren" oder wählen Sie im Datenbankerstellungsfenster die Option "Registrieren nach Erstellung".

Als Ergebnis öffnet sich der Dialog „Datenbankparameter“ (Abb. 4), in dem Sie fast die gleichen Felder wie beim Anlegen der Datenbank ausfüllen müssen und dann auf die Schaltfläche klicken.

Um die Richtigkeit der im Datenbankregistrierungsfenster eingegebenen Parameter zu überprüfen, klicken Sie auf die Schaltfläche [Verbindung prüfen]. Dadurch wird das Dialogfeld CommunicationDiagnostics mit dem Feld TestResults geöffnet, das die Verbindungsergebnisse enthält. Es wird auch Informationen über die Version des verwendeten DBMS geben.

Nach der Registrierung werden alle eingegebenen Informationen über die Datenbank von der IBExpert-Anwendung gespeichert und ein Knoten mit der registrierten Datenbank wird dem Fenster „DatabaseExplorer“ auf der Registerkarte „Datenbanken“ hinzugefügt (Abb. 5) *.

Um eine Verbindung zu einer registrierten Datenbank herzustellen, wählen Sie die gewünschte Datenbank in der Liste aus (Abb. 5) und führen Sie den Befehl „Datenbank > Mit Datenbank verbinden“ aus oder doppelklicken Sie auf die ausgewählte Datenbank.

Wurden alle Verbindungsparameter korrekt eingegeben, wird die Verbindung zur Datenbank hergestellt, der Name der verbundenen Datenbank im Fenster "DatabaseExplorer" fett hervorgehoben und es erscheinen verschachtelte Knoten mit Objekten, die in der verbundenen Datenbank enthalten sind

Nachdem Sie eine Verbindung zur Datenbank hergestellt haben, können Sie vorhandene Objekte anzeigen, neue erstellen, Daten eingeben und anzeigen sowie Operationen mit vorhandenen Objekten ausführen.

Vorgehensweise: Installieren Sie VisualStudio auf Ihrem Computer. Es lohnt sich, das erweiterte Kit zu installieren, da das Standard-SQL nicht enthalten ist. Öffnen Sie VisualStudio, wählen Sie die Registerkarte "Tools" → "ConnecttoDatabase". Wählen Sie im erscheinenden Fenster den Datenbanktyp „MicrosoftSqlServerDatabasefile“ → „Weiter“. Wählen Sie im angezeigten Fenster den Speicherort für die Datenbank auf dem Computer aus. OK klicken". Danach erscheint die Datei der erstellten Datenbank in der Dateiliste auf der rechten Seite des Bildschirms. Doppelklicken Sie auf die Datenbankdatei. Klicken Sie in der sich öffnenden Liste mit der rechten Maustaste auf "Tabellen" → "Neu". Es erscheint ein leeres Tabellenfeld. Wir füllen die Tabelle aus. Die Tabellen werden nach dem zuvor erstellten Modell gefüllt. Tatsächlich übertragen wir das Modell auf SQL. Um eine neue Tabelle anzulegen, wiederholen Sie Schritt 5. Eines der Tabellenfelder muss als Schlüssel gesetzt sein. Wählen Sie dazu das gewünschte Feld aus (meistens sind die Schlüsselfelder Felder mit ID) und klicken Sie auf das Schlüsselzeichen in der Symbolleiste. In jeder Zeile müssen Sie einen Datentyp auswählen. Der Datentyp bestimmt, wie ein Objekt Informationen in einem bestimmten Feld speichern kann. Sobald ein bestimmter Datentyp festgelegt wurde, ist es nicht mehr möglich, Daten eines anderen Typs einzugeben. Wenn unser String einen Textwert enthält, können dies die Typen CHAR (M), VARCHAR (M), TINYBLOB, TINYTEXT, BLOB, TEXT, MEDIUMBLOB, MEDIUMTEXT, LONGBLOB, LONGTEXT sein - abhängig von der geschätzten Speichermenge, die der String haben wird Geschäft. Wenn der Datentyp eine Zahl ist, sind BOOLEAN, INTEGER, DECIMAL, FLOAT, REAL, DOUBLE, PRECISION ausreichend. Wenn Sie die Zeichenfolge speichern, werden Daten über Uhrzeit und Datum gespeichert, dann verwenden wir DATE, TIME, TIMESTAMP, DATETIME. Binärdaten können vom Typ "Binär", "Bild", "Varbinär" sein. Andere Datentypen: "cursor", "hierarchyid", "sql_variant", "table", "timestamp", "uniqueidentifier", "xml", "Räumliche Typen".



14.Verwenden des Internets zum Sammeln von Quellen. Wissenschaftliche Zusammenarbeit.

Moderne Ansätze zur Nutzung von Computernetzwerken beinhalten die Implementierung von Informationsinteraktionen zwischen den Teilnehmern Bildungsprozess in verschiedenen Betriebsarten der Weltinformationsumgebung. Die Internettechnologie stellt modernen Benutzern alle Ressourcen der globalen Telekommunikation zur Verfügung und ermöglicht die Organisation von Bildungsaktivitäten unter Verwendung von angewandten und instrumentellen Softwarewerkzeugen und -systemen, die dem modernen Benutzer zur Verfügung stehen. Diesbezüglich vielversprechende Richtung ist die Entwicklung wissenschaftlicher und pädagogischer Grundlagen für die Schaffung und Nutzung der globalen Informationsumgebung für lebenslanges Lernen auf der Grundlage der Schaffung eines einheitlichen Bildungsraums (Informations- und Fachumgebung) auf regionaler / globaler Ebene.

Bei all der Vielfalt der Informations- und Telekommunikationstechnologien sowie der Möglichkeiten, Daten zu organisieren, wenn sie über Kommunikationskanäle gesendet werden, nimmt das Weltinformations-Computernetzwerk, das Internet, einen zentralen Platz ein. Darüber hinaus ist es heute praktisch das einzige globale Telekommunikationsnetz, das im allgemeinbildenden Sekundarschulsystem universell genutzt wird. Dies liegt vor allem an der hohen Geschwindigkeit und Zuverlässigkeit der Datenübertragung über das Internet verschiedener Formate (Text, grafische Bilder, Ton, Video usw.) Das Internet bietet die Möglichkeit des kollektiven Zugangs zu Bildungsmaterialien, die sowohl in Form einfacher Lehrbücher (elektronische Texte) als auch in Form komplexer interaktiver Systeme, Computermodelle, virtueller Lernumgebungen präsentiert werden können , usw. usw. Die Zahl der Nutzer und Informationsquellen im Internet nimmt ständig zu. Darüber hinaus verbessert sich die Qualität der bereitgestellten Telekommunikationsdienste ständig.



Die Informatisierung ist einer der Hauptfaktoren für die Verbesserung der Bildung. Die Inhalte und Methoden des Unterrichts ändern sich, die Rolle des Lehrers ändert sich, der sich allmählich von einem einfachen Wissensübersetzer zu einem Organisator der Aktivitäten der Auszubildenden zum Erwerb neuer Kenntnisse, Fähigkeiten und Fertigkeiten wandelt. Ein wesentliches Mittel der Informatisierung sind im Internet veröffentlichte Bildungsinformationsressourcen, die Folgendes ermöglichen:

· Nutzung von Informationen, die auf Bildungs- und Wissenschaftsseiten im Internet (Websites) veröffentlicht sind, zur Erstellung von Lehr- und Methodenmaterial. Zusammenfassungen und Nachrichten;

Organisation einer Repräsentanz Bildungseinrichtung im Internet;

· Erstellung einer Website, die sich mit den Inhalten der Schuldisziplin und ihrer Platzierung im Internet befasst;

· Hosting von persönlichen Websites von Lehrern und Schülern.

Der Weg zum riesigen Informationsgepäck der Menschheit, das in Bibliotheken, Musikbibliotheken, Filmbibliotheken aufbewahrt wird, führt über Katalogkarten. Ähnliche Mechanismen gibt es im Internet, um die benötigten Informationen zu finden. Dies sind Suchmaschinen, die als Ausgangspunkt für Benutzer dienen. Inhaltlich kann man sie als einen weiteren besonderen Service des Internets bezeichnen.

Es gibt viele Kataloge und Portale im Internet, die Informationen sammeln, die von Lehrern verwendet werden können. Die Nutzung solcher Kataloge und Informationsquellen im Internet empfiehlt sich für:

· zeitnahe Versorgung von Lehrkräften, Auszubildenden und Eltern mit relevanten, zeitnahen und verlässlichen Informationen entsprechend den Bildungszielen und -inhalten;

· Organisation verschiedener Formen von Praktikantentätigkeiten im Zusammenhang mit der selbstständigen Beherrschung des Wissens;

Anwendung moderner Informations- und Telekommunikationstechnologien (Multimedia-Technologien, virtuelle Realität, Hypertext- und Hypermedia-Technologien) in Bildungsaktivitäten;

· Objektive Messung, Bewertung und Prognose der Wirksamkeit der Ausbildung, Vergleich der Ergebnisse der Bildungsaktivitäten von Schülern mit den Anforderungen des staatlichen Bildungsstandards;

· Management der pädagogischen Tätigkeit des Schülers entsprechend seinem Kenntnisstand, seinen Fähigkeiten und Fertigkeiten sowie den Besonderheiten seiner Lernmotivation;

· Schaffung von Voraussetzungen für das individuelle Selbststudium von Schülern;

· Ständige und operative Kommunikation zwischen Lehrern, Auszubildenden und Eltern, um die Effektivität der Ausbildung zu erhöhen;

· Organisation des effektiven Betriebs allgemeinbildender Einrichtungen in Übereinstimmung mit den normativen Bestimmungen und sinnvollen Konzepten des Landes.

Eine Vielzahl von Informationsquellen im Internet kann für die Verwendung im allgemeinbildenden Sekundarbereich geeignet sein. Unter diesen Ressourcen kann man pädagogische Internetportale hervorheben, die selbst Kataloge von Ressourcen, Diensten und Instrumentencomputern sind Software, elektronische Präsentation von Papierausgaben, elektronische Bildungsinstrumente und Mittel zur Messung von Lernergebnissen, Ressourcen mit Nachrichten, Ankündigungen und Mittel zur Kommunikation der Teilnehmer am Bildungsprozess.

Mithilfe der Informationsressourcen des Internets können Lehrer die kognitive Aktivität von Vorschulkindern effektiver steuern, die Ergebnisse von Bildung und Erziehung schnell verfolgen, angemessene und geeignete Maßnahmen ergreifen, um das Lernniveau und die Qualität des Wissens der Schüler zu verbessern, pädagogische Kompetenzen gezielt verbessern, zeitnahen gezielten Zugang zu den erforderlichen pädagogischen Informationen haben, methodischer und organisatorischer Natur sind. Pädagogen, die an der Entwicklung ihrer eigenen Informationsressourcen beteiligt sind, erhalten eine zusätzliche Möglichkeit, Fragmente der im Netzwerk veröffentlichten Bildungsressourcen zu nutzen, wodurch die erforderlichen

Die meisten der qualitativ hochwertigsten Informationsressourcen, deren Nutzung die Effizienz der allgemeinbildenden Sekundarstufe erhöhen würde, sind auf Bildungsportalen im Internet katalogisiert. Derzeit hat Russland bereits ein Organisationsschema für die Schaffung eines Systems von Bildungsportalen entwickelt, das seine eigenen Merkmale hat. Das Organigramm zum Aufbau eines Systems von Bildungsportalen umfasst:

· Horizontales Portal "Russische Bildung" (www.edu.ru),

Profil vertikale Portale nach Wissensbereichen: humanitäre, wirtschaftliche und soziale, Naturwissenschaften, Ingenieurwissenschaften, Pädagogik, Medizin, Landwirtschaft usw.,

Spezialisierte vertikale Portale: Buchveröffentlichung, einheitliche Prüfung, Bildungsnachrichten usw.

Das horizontale Portal "Russische Bildung" bietet:

· Navigation durch alle vertikalen Portale;

· Suche nach Multimedia-Informationen im Bildungsbereich im Internet;

Personalisierung und persönliche Anpassung der Oberfläche, sowohl durch Auswahl einer eigenen Kategorie (Lerner, Lehrer, Administrator, Portalentwickler) und Angabe des Bildungsniveaus, als auch durch Gestaltung eigene Schnittstelle;

· Bildung und Bereitstellung von Querschnitten vertikaler Portale nach Bildungsstufen;

· Speicherung und Bereitstellung von Informationen im Bildungsbereich (Gesetze, Verordnungen, Verordnungen, Normen, Fachverzeichnisse, Bundeslehrbuchsammlung, Hochschuldatenbank etc.);

· Veröffentlichung einer täglichen Presseschau zum Thema Bildung;

· Newsfeed im Bildungsbereich;

· Organisation von Foren, Diskussionsgruppen, Mailinglisten.

Aus der Welt der Wissenschaft, Demoscope, Scopus

EINLEITUNG

Das Internet ist wie eine riesige Weltbibliothek, die nur einen, aber wesentlichen Unterschied hat: Für die Suche nach einem Buch in der Bibliothek gibt es einen Katalog, im Extremfall kann man sich an einen erfahrenen Bibliothekar wenden. Es gibt keinen vollständigen Katalog des Internets. Trotzdem ist die Suche im globalen Computernetzwerk möglich, und dies ist vielleicht einer der wichtigsten Aspekte. Um im Netzwerk nach Daten zu suchen, werden spezielle Server verwendet, deren Informationen nahezu automatisch gepflegt und aktualisiert werden.

Heute, da das Internet zu einer der wichtigsten Informationsquellen geworden ist, gewinnt die Internetsuche immer mehr an praktischem Wert. Aber mit der rapiden Zunahme der verfügbaren Datenmenge wird der Suchvorgang selbst immer komplizierter.

Das Internet ist ein globales Computernetzwerk, das sowohl Computernetzwerkbenutzer als auch PC-Benutzer verbindet. Das Internet wird langsam aber sicher zum wichtigsten Mittel der Unternehmenskommunikation und ist bisher dem Telefon gewichen.

Es gibt eine riesige Menge an Informationsquellen im Web. Schätzungen zufolge hat die Zahl der Dokumente 65 Millionen überschritten und wächst weiterhin schnell. Eine solche Informationsmenge erfordert die richtige Organisation des Suchprozesses und den Einsatz spezieller technischer Mittel, wie beispielsweise Suchmaschinen. Eine einfache Suche nach einem recht häufigen Schlüsselwort liefert normalerweise Zehntausende bis mehrere Millionen Links. Es liegt auf der Hand, dass die Arbeit mit einer so großen Zahl von Dokumenten praktisch unmöglich ist, zumal die überwältigende Mehrheit von ihnen Informationen enthält, die für den Fall nicht relevant sind.

Informationsquellen im Internet unterscheiden sich in der Art und Weise, wie Informationen präsentiert werden und folglich auch in der Art des Zugangs zu ihnen.

1 SUCHWERKZEUGE

1.1 Dateisuchwerkzeuge

Das manuelle Auffinden der Datei in der komplexen Verzeichnisstruktur des FTP-Servers kann lange dauern. Um die Suche zu vereinfachen und zu beschleunigen, wurde der Archie Internet Search Service entwickelt, ein spezieller Archie-Server, der den Inhalt von Verzeichnissen anonymer FTP-Server speichert. Bei der Adressierung einer Suchanfrage auf einem Archie-Server ist das Suchergebnis eine Liste von Adressen anonymer FTP-Server, auf denen sich die gewünschte Datei befindet.

Es stellt sich jedoch die Aufgabe, die gewünschte unter den Dateien auf diesem Server zu finden, was aufgrund der unklaren und unverständlichen Namen von Dateien und Verzeichnissen ziemlich schwierig ist. Um dieses Problem zu lösen, wird das Gopher-System verwendet, mit dem Sie durch ein System von Kontextmenüs navigieren und den Inhalt von Dateien mit verständlichen Notationen anzeigen können. Es gibt viele Gopher-Server, die Datenarchive in Form von hierarchisch strukturierten Verzeichnissen enthalten, die nach Inhalt geordnet sind. Das Arbeiten mit ihnen ist sehr einfach und entspricht dem Arbeiten mit der üblichen Darstellung des Dateisystems.

Es gibt eine Erweiterung dieses Systems - Veronica, die Verzeichnisse aller Gopher-Server in ihrer Datenbank enthält. Nach Eingabe einer Suchabfrage durchsucht Veronica automatisch alle Gopher-Verzeichnisse nach den gesuchten Informationen, wodurch das manuelle Durchsuchen vieler Gopher-Server entfällt.

Mit dieser Navigationsweise war die Gopher gewissermaßen der Vorläufer des WWW. Derzeit nimmt die Nutzung von Gopher proportional zur Zunahme der Nutzung des WWW ab.

1.2 WWW-Tools - WorldWideWeb

1993 wurde das WWW-Informationsabrufsystem entwickelt, das aufgrund seiner einfachen Navigation und Zugänglichkeit Informationsquellen des Internets für unvorbereitete Benutzer öffnete. Das WWW hat einen Internet-Boom ausgelöst, der bis heute anhält, und das Informationsangebot im Internet verdoppelt sich jedes Jahr.

Das WWW basiert auf dem Hypertext-Prinzip (dem Leser bereits bekannt), dh auf einem System von Dokumenten, die durch Hyperlinks verbunden sind. Hypertext ist eine spezielle Methode, um Schlüsselwörter aus gewöhnlichem Text hervorzuheben. Hypertext-Links leiten den Benutzer zu anderen Dokumenten auf demselben Server oder zu anderen Servern, die sich irgendwo im Internet befinden können. Handelt es sich bei diesem Textdokument auch um Hypertext, können Sie über dessen Links weiter zu den entsprechenden Dokumenten gelangen. Jede Umleitung erfolgt für den Benutzer unmerklich, so dass er die Informationsinhalte des Internets sinnvoll einsehen kann, ohne sich Gedanken über die Adressierung bestimmter Rechner machen zu müssen.

Mit der Entwicklung multimedialer Anwendungen werden aus zunächst reinen Hypertextdokumenten zunehmend Hypermedien. Somit können WWW-Dokumente in jedem beliebigen Datenformat vorliegen: Text, Grafik, Ton/Musik oder Videoclip. Die Orientierung und Navigation im World Wide Web erfolgt über spezielle Programme, sogenannte WWW-Browser, die eine Benutzeroberfläche bereitstellen, wie zB NetscapeNavigator oder MicrosoftInternetExplorer.

Ausgangspunkt für die Suche nach Informationen ist in der Regel die Haupt-(Basis-, Homepage-)Seite (Site) der Informationsressource, die durch Eingabe der entsprechenden Adresse im Browser (zum Beispiel http://ncpi .gov.by oder www.iparegistr.com). WWW-Sites werden von Unternehmen oder speziellen Organisationen erstellt und aktualisiert, die Informationen veröffentlichen und den Inhalt ihrer WWW-Seiten überwachen. Die Nutzung des WWW ist daher nicht passiv, und jeder Internetnutzer kann mit Hilfe spezieller Hypertext-Editor-Programme selbstständig seine eigenen interaktiven WWW-Seiten erstellen. Damit war der Weg für die zunehmende Kommerzialisierung und Expansion des Internets geebnet.

Derzeit werden die neu erstellten Informationen in der Regel unter Berücksichtigung der Notwendigkeit eines WWW-Zugangs erstellt und ältere Dokumente werden nach und nach dafür konvertiert, aber weltweit gibt es immer noch Millionen von Dateien in anderer Form als WWW Bedarf. Für die Nutzung dieser Informationen und über das WWW sind die oben genannten Internetdienste in den Browsern enthalten, die den Zugriff darauf ermöglichen (Telnet, FTP, Archie, Gopher). Über das WWW können Sie auch andere Internetdienste nutzen, die zur Kommunikation bestimmt sind (eMail, NetNews). Daher ist der WWW-Browser mittlerweile ein universelles Kommunikationsprogramm für das Internet geworden.

Mit dem Aufkommen des WWW-Dienstes begann der Internet-Boom. Diese einfach zu bedienende, benutzerfreundliche Umgebung für alle Dienste hat das Interesse vieler Menschen und Organisationen im Internet geweckt. Es stellte sich plötzlich heraus, dass man kein Internet-Experte sein musste, um die Dienste des Netzwerks zu nutzen. Dies kann mit dem Erfolg von Microsoft bei der Veröffentlichung von Microsoft Windows als grafische Benutzeroberfläche verglichen werden. Vor dem Erscheinen von Windows hatte jede DOS-Anwendung ihr eigenes Benutzerhandbuch und erforderte daher, dass jede Anwendung separat studiert wurde.

2 GRUNDLEGENDE TECHNIKEN ZUM FINDEN VON INFORMATIONEN IM INTERNET

2.1 Grundvoraussetzungen für die Suche

An die Suchergebnisse werden Anforderungen an die Vollständigkeit der Ressourcenabdeckung, die Verlässlichkeit der gewonnenen Informationen, den minimalen Zeitaufwand und die maximale Suchgeschwindigkeit gestellt.

Die Forderung nach Vollständigkeit der Ressourcenabdeckung bedarf keiner weiteren Erläuterung, mit Ausnahme der Notwendigkeit, Ressourcen nicht nur für das WWW, sondern auch für andere Internetdienste bei der Suche zu verwenden.

Die Verlässlichkeit von Informationen wird angesichts der Beschaffenheit des Internets zu einer äußerst wichtigen Anforderung. Die Bewertung der Zuverlässigkeit kann sowohl mit traditionellen Methoden (Prüfung der Rechtmäßigkeit von Veröffentlichungen auf Papier, Einholung von Informationen über Organisationen und Autoren, Überprüfung der Gültigkeit ihrer elektronischen Ressourcen usw.) mit alternativen Informationsquellen, Abgleich von Faktenmaterial, Ermittlung der Häufigkeit seiner Verwendung durch andere Quellen; Ermitteln des Status des Dokuments und der Bewertung der Quelle durch Suchmaschinen, Einholen von Informationen über die Kompetenz und den Status des Autors des Materials über spezielle Internet-Suchdienste, Analyse einzelner Elemente der Site-Organisation, um die Qualifikation der unterstützenden Spezialisten zu beurteilen, und mehr).

Die Suchzeit, die für Verbindungsspezifikationen aufgewendete Zeit nicht mitgezählt, hängt weitgehend von der Suchplanung und den Fähigkeiten des Suchingenieurs mit der Art der Ressource der ausgewählten Ressource ab. Bei der Suchplanung geht es darum, die Suchdienste zu bestimmen, die zum Auflösen einer Suchanfrage erforderlich sind, und die Reihenfolge, in der sie angewendet werden. Darüber hinaus hängt viel von den Fähigkeiten und Erfahrungen des einzelnen Suchspezialisten ab.

Wie bereits erwähnt, stehen Informationen im Internet aus verschiedenen Quellen zur Verfügung. Dies sind in erster Linie WWW-Ressourcen (Hypertextsystem, Ressourcenkataloge, Suchmaschinen). Darüber hinaus sind dem Leser bereits E-Mail, Mail-Roboter, Usenet und andere Newsgroups, sowie FTP-Systeme und Archive (unter Verwendung von Gopher und Veronica) bekannt. WWW ermöglicht die Suche nach den erforderlichen Ressourcen anhand seiner Hypereigenschaften, dh vorhandene Suchmaschinen arbeiten mit Hyperlinks im automatischen Modus, ohne die Möglichkeit des manuellen Browsens auszuschließen. Das WWW bietet eine Reihe von allgemeinen und spezialisierten Suchdiensten.