ИЩЕМ И НАХОДИМ

Большой гайд по поиску информации в Сети
  • Анастасия Пахорукова

    2025
Нет ничего проще и ничего сложнее, чем найти информацию в интернете. Ответы на популярные вопросы часто лежат на поверхности. Но стоит копнуть глубже, и вы погружаетесь в пучины заброшенных форумов, страниц 404 и SEO-текстов. Рассказываем, как прокладывать маршрут в этом море информации.

Как работает информационная среда

Большинство посетителей библиотек не могут найти в них необходимую информацию без помощи библиографов и каталогов. Почему же тогда мы считаем что поиск в интернете — гигантской библиотеке человеческих знаний — не требует специальных навыков?

Для эффективного поиска информации необходимо, во-первых, понимать принципы существования информационной среды, во-вторых, грамотно формулировать цель поиска. Пользователь, слабо ориентирующийся в Сети, не сможет отличить рекламную статью от серьёзной аналитики.
яблоко на стопке книг
Сервис, который помогает находить информацию в интернете, например, Google, Яндекс, Bing. У каждого поисковика — свои алгоритмы, поэтому разные сервисы выдают по запросу разные результаты.
Интернет основан на принципе гипертекста. Перекрёстные ссылки связывают огромные массивы информации таким образом, что к любой странице можно быстро получить доступ. Но существуют веб-страницы, на которых количество внешних ссылок сведено к минимуму. Это делается для того, чтобы удержать пользователей на одном ресурсе. И первоисточники информации, использованную литературу, авторов цитат с этого сайта вам придётся искать самостоятельно. Невозможно предсказать, сколько поисковых запросов потребуется в каждом конкретном случае, сколько сайтов придётся посетить.

Поисковые системы предлагают нам тысячи страниц в ответ на простой запрос. Результаты будут отличаться, если поменять порядок слов, заменить на синонимы, допустить орфографическую ошибку. Принципиально разная информация по ключевым словам найдётся в соцсетях и «Википедии», на портале частных объявлений или в онлайн-СМИ. К тому же поисковики зарабатывают на показе информации: на первой странице будут расположены платные объявления и сайты компаний, вложившие средства в SEO — оптимизацию контента под поисковые запросы.
Прежде чем искать информацию, она должна быть индексирована, то есть добавлена в базу данных. Например, в библиотеке индексируется каждая статья в журнале. Её описание помещается на карточку, приписываемую к определённому разделу каталога. В интернете можно индексировать не только каждую статью, но и каждое предложение текста. Делает ли это поиск легче? Нисколько.

Анастасия Пахорукова
методист, педагогический дизайнер компании Silamedia

Как использовать операторы поиска

неаккуратная стопка книг
Чаще всего в России для поиска информации используют Google и «Яндекс». Но это только малая часть поисковых систем, есть ещё Bing, DuckDuckGo, Baidu… А в последнее время появляются поисковики с искусственным интеллектом. Самый известный из них — Perplexity. Но недостаточно выбрать удобный поисковик. Нужно ещё грамотно составить запрос и выбрать подходящий инструмент.

Так, в некоторых случаях полезно искать информацию не в российской версии Google, а в локальной. Например, Google для Германии — google.de, для Франции — google.fr. Полный список есть на этой странице.
1
Применяйте операторы поиска — специальные символы и команды, которые позволят сразу сузить и уточнить запрос.
2
Включайте расширенный поиск — функцию, которая позволит более точно настроить параметры. Она доступна почти во всех поисковых системах.
3
Отфильтруйте результаты поиска. И в «Яндексе», и в Google, и в Perplexity можно отдельно посмотреть найденные изображения, видео и товары. В первых двух также есть настройки безопасного поиска или выбор контента с определённой лицензией авторского права. В Perplexity фильтры позволяют просмотреть только научные публикации.
В 99% случаев и ваших личных информационных запросов вам будет абсолютно достаточно соответствующей страницы «Википедии».

«Википедия» — великолепный ресурс, который по привычке многие считают мусорным: случайная информация, неизвестные авторы, кто угодно может править статьи. Все это так и не так. Качество «Википедии» есть функция от количества активных участников. Чем больше людей пишет, правит и, соответственно, читает статьи, тем они лучше. Соответственно, самый качественный сегмент — это, естественно, англоязычная «Википедия».

Русскоязычная «Википедия» интегрально похуже. Но если вы непрофессиональный пользователь и несистемно работаете с информацией, вы этого не заметите. Шанс наткнуться на какую-то серьезную ошибку в «Википедии» сейчас очень-очень-очень мал.

Илья Бер
журналист портала Delfi, руководитель проекта «Проверено.Медиа»

Как искать по изображению

Мы привыкли чаще всего использовать для поиска текстовые запросы. И всё же иногда есть смысл сразу искать визуальную информацию: у большинства поисковых систем есть функция загрузки изображения. Не ограничивайтесь одним сервисом! У них разные алгоритмы работы, что может давать заметно отличающиеся результаты.
сервис, в котором можно фильтровать результаты поиска по размеру, типу файла, лицензии и другим параметрам.
второй сервис от Google, больше предназначен для мобильных телефонов. Умеет распознавать текст, объекты, места и многое другое.
ещё один сайт, на котором можно загрузить фотографию или указать URL изображения.
российская версия поисковика, которая лучше справляется с сайтами на русском языке.
мобильное приложение, которое ищет информацию об объектах, попавших в объектив смартфона.
яблоко на стопке книг
В некоторых ситуациях нужен не сам снимок, а текстовая информация на нём (например, вы сфотографировали слайд презентации или название магазина на билборде). Тогда логичнее использовать не поисковик, а сервис распознавания текста (OCR). Можно открыть сайт OnlineOCR.net, который позволяет извлекать и конвертировать текст. Конечно, при плохом качестве исходного файла некоторые слова или фразы могут быть распознаны некорректно.

Во время фактчекинга часто приходится прибегать к реверсивному поиску, то есть к поиску первоисточника изображения и выявлению фейков или манипуляций. На реверсивном поиске специализируется сервис TinEye. Загрузите в него картинку, и вы увидите похожие или идентичные изображения, которые когда-то были выложены в Сеть.

Как искать информацию не только в Google и «Яндекс»

Поисковики ищут информацию по всему интернету. Поэтому для специализированных запросов удобнее обращаться к цифровым архивам — базам оцифрованных документов. Для каждого файла указано его название, дата создания, автор и ключевые слова. Всё это существенно ускоряет поиск нужной информации.
яблоко на стопке книг
На сайтах государственных архивов выложены исторические документы, фотографии, карты и другие материалы
Академические ресурсы хранят публикации, научные статьи, результаты исследований
Библиотеки, особенно специализированные научные, могут иметь значительные коллекции архивных материалов
Музеи часто собирают коллекции исторических документов, фотографий и артефактов

Как найти информацию о конкретном человеке

яблоко на стопке книг
Объёмы информации, загруженные в интернет, растут не по дням, а по часам. Можно считать, что каждый человек сам по себе является небольшим медиа. А точнее — трансмедиа, потому что на разных площадках мы выкладываем разные части своей истории.

Соответственно, и при поиске информации о каком-либо человеке, приходится изучать несколько баз данных.
Большинство людей даже не осознаёт, как много личной информации добровольно выкладывает о себе. Этими цифровыми следами легко можно воспользоваться не только для поиска, но и с целями мошенничества, угроз, кражи персональных данных.

Подробнее об этом можно прочитать в нашем спецпроекте.

Как интерпретировать результаты поиска

неаккуратная стопка книг
Как часто вы заглядываете на пятую страницу поисковой выдачи? десятую? на какой самой «дальней» странице вообще бывали? Кажется, что самая релевантная — то есть лучше всего соответствующая запросу — информация должна располагаться в начале. Но на практике это не всегда так.

Поисковые системы сортируют сайты в поисковой выдаче, основываясь на множестве факторов. Чем надёжнее и правдоподобнее поисковик считает ссылку, тем выше она находится. Это называется ранжированием.

При ранжировании учитываются популярность и цитируемость сайта, качество контента, сами алгоритмы поисковиков, соответствие интересам пользователя (последнее считается так же, как и в умных лентах социальных сетей). К тому же многие поисковые системы зарабатывают на показе информации, поэтому платные объявления и сайты компаний, вложившие средства в SEO-оптимизацию, часто располагаются на первой странице выдачи.

SEO (Search Engine Optimization) — оптимизация контента под поисковые запросы. Это выделение заголовков тегами, заполнение полей alt для изображений, применение ключевых слов.


Иногда SEO-оптимизация отрицательно влияет на контент: так, некоторые веб-страницы генерируются прямо под конкретный запрос пользователя, в материалы вставляются не относящиеся к их теме ключевые слова, гиперссылки ведут на случайные страницы.

Рекламные объявления тоже часто оформляют так, чтобы они не отличались от «нормальной» поисковой выдачи. Их можно скрыть через блокировщики, ad-blockers, или сразу пропускать несколько первых результатов.

Как проверять информацию

Правильно оценивать найденную информацию помогут навыки верификации и фактчекинга. Эти термины можно воспринимать как синонимы, хотя разница есть: верификация обычно проводится в процессе создания материала, а фактчекинг — после его публикации. Соответственно, как пользователи мы занимаемся именно фактчекингом, а как журналисты — верификацией.
Алгоритм проверки информации
Кто автор материала? Что даёт ему право писать на эту тему?
Что именно вы нашли? Это факт, мнение или план?
Где находится первоисточник? Куда ведут гиперссылки в тексте?
С чьей помощью создана информация? Кто владеет сайтом, на кого ссылается автор?
Для какой цели был создан и размещен материал?
Как был создан материал? Это серьёзное исследование, компиляция или сгенерированный текст?
Когда была создана, опубликована, обновлена информация?
неаккуратная стопка книг
Верификация и фактчекинг позволяют ориентироваться в той информации, которой переполнен интернет. Без этих навыков сложно найти адекватные источники информации, отличить фишинговый сайт от оригинального, сформировать здоровое медиаполе. И не нужно переживать: верификация и фактчекинг доступны любому человеку, потребуется лишь интеллектуальное усилие и постоянная практика.

Потренируйтесь, выполняя несложные упражнения. Например, найдите достоверную информацию о Всемирном дне писателя (подсказка: сравните русскоязычные и англоязычные источники) или вычислите настоящего автора цитаты «Боль неизбежна. Страдание — личный выбор каждого» (подсказка: используйте сервисы поиска по книгам).

Как проводить глубокий поиск

Если вы добрались до этого раздела, то уже готовы перейти от простого поиска к настоящему исследованию. Для удобства будем отличать краткосрочный поиск — ответ на один конкретный запрос — от поиска долгосрочного.

Долгосрочный поиск предполагает сбор максимального объёма контента на заданную тему. Он нужен при написании научных работ, проведения журналистских расследований или самостоятельного изучения новой области знаний. Да, применение операторов поиска по-прежнему актуально, но ещё более важно разрабатывать стратегию, формировать наборы ключевых слов, искать в различных базах и на разных языках, оценивать релевантность полученных результатов.
неаккуратная стопка книг
  • Комплексное исследование темы цифрового хранения информации. Максвелл Нили-Коэн для написания лонгрида не только анализировал многочисленные источники, но и опрашивал архивы, библиотеки, коллекционеров.
    Посмотреть материал
  • Мимолётный интерес к слову «технология» привёл Оксану Силантьеву от русской и английской Википедии до изучения «Никомаховой этики». Для глубокого погружения потребовалось даже скачать её текст на разных языках, включая греческий.
    Открыть пост
  • Неожиданная находка в покупном лимоне так заинтересовала Дэна Расселла, что он нашёл упоминания подобных случаев в трудах исследователей XVIII века. Запрос «lemon inside lemon» — научный термин «citrum in citro» — поиск на Google Books.
    Прочитать заметку

Как избежать эрозии информации

яблоко на стопке книг
Помните высказывания: «то, что попало в Сеть, остаётся в ней навсегда», «интернет всё помнит»? Увы, оно далеко от реальности. Информация устаревает и исчезает — этот эффект называют «эрозией».

С 2013 по 2023 года исчезла четверть когда-либо существовавших страниц. Да, за это время мы создали гораздо больше новых, но восполнят ли они нам пропавшую информацию? Более чем на половине страниц «Википедии» есть неработающая ссылка, ведущая на первоисточник. Ситуацию в соцсетях сложно проанализировать — аккаунты удаляются, перепродаются или скрываются настройками приватности. А вместе с этим исчезает и контент.
Технические причины
  • старые форматы файлов больше не читаются
  • носители информации имеют ограниченный срок службы
  • старые протоколы несовместимы с современными
Финансовые факторы
  • своевременный перенос данных требует расходов
  • компании ориентированы на прибыль, а не долговременность
  • для любого сайта нужно оплачивать домен и хостинг
Правовые аспекты
  • законодательство ужесточается
  • на любой контент можно подать жалобу
  • политические конфликты приводят к цензуре и блокировкам
Централизация экосистемы
  • крупные IT-компании закрывают платформы
  • децентрализованные системы пока нестабильны
  • основная информация хранится на серверах, а не у пользователей
Поведенческие причины
  • предпочтение свежего контента, а не старого
  • небрежность самих пользователей
  • отсутствие персональной ответственности
Исчезающий контент, как правило, малозначим. К примеру, в Рунете за последнее десятилетие были потеряны тематические форумы, на которых сидели радиолюбители, сантехники или мастера шитья. Некоторые платформы из-за отсутствия поддержки криптопротоколов https перестали работать в современных браузерах, а затем были отключены за неуплату хостерам.

Евгений Харитонов
главный редактор Ferra.ru
При работе над собственным медиапроектом или продуктом стоит заранее подумать о том, как сохранить информацию надолго. Во-первых, необходимо сделать несколько копий, хранящихся на разных носителях. И одну копию — в облачном сервисе. Во-вторых, сделать выбор в пользу форматов контента, не зависящих от коммерческих структур. Проще всего с текстом, сложнее — с интерактивом, вспомните только прекращение поддержки технологии flash. В-третьих, подумать о том, как снизить зависимость от централизованных платформ. Например, выложить лонгрид сразу на нескольких площадках. Наконец, назначить ответственных за хранение информации и доступность контента и продумать о том, как дальше будет передаваться эта обязанность.

Как искать интернет-ресурсы, уже съеденные эрозией

неаккуратная стопка книг
Над проблемой долгосрочного сохранения контента задумываются достаточно редко. Тем не менее существуют специализированные веб-порталы, которые занимаются архивированием сайтов, позволяя найти их даже после удаления оригинального ресурса.

Internet Archive (известный как Wayback Machine) — цифровая библиотека, сохраняющая книги, изображения и мультимедиа, а также
сайты с 1996 года.

Archive.today — сервис, который делает снимок веб-страниц, сохраняя текст и графические изображения, но удаляя активные элементы.

Национальный цифровой архив — сохраняет официальные сайты российских органов власти и страницы официальных аккаунтов в соцсетях.

Однако эти порталы могут сохранять в основном текстовую информацию и навигацию по сайтам, но не всегда крупные видео или изображения. Вопрос же хранения интерактивного контента до сих пор подвешен в воздухе.

Кстати, в рамках российского законодательства пользователи могут запрашивать у соцсетей архивы с удалёнными данными профиля.

Три уровня поискового погружения

Даже развитие нейросетей не заставит нас полностью отказаться от поисковых систем. Они по-прежнему будут нужны для проверки фактов, ссылок, специализированных данных и актуальной информации.

  • Инструменты

    поиска

    Первый уровень погружения, который требует знания операторов поиска и специализированных поисковых систем. Нужен для верификации и фактчекинга, ответов на вопросы.

  • Долгосрочные стратегии

    Второй уровень, где важны смыслы: предметная область, ключевые слова. А ещё пригодится умение работать с неиндексируемыми ресурсами. На этом уровне проводятся исследования.

  • Противодействие эрозии

    На третьем уровне мы задумываемся не только о поиске информации, но и о том, как сохранить собственный контент доступным для поиска даже спустя несколько лет. Необходим всем, кто создаёт медиапроекты.

Made on
Tilda