Продвинутый поиск в Гугл


Оглавление

1. Поиск информации в Интернете

2. Операторы и уточнение поисковых запросов Google

3. Расширенные возможности поиска в Гугл

4. Полный набор операторов поиска Гугл

5. Поиск в Google для хакеров

6. Источники


Поиск информации в Интернете

Поисковые системы сканируют информацию и составляют поисковую выдачу на основе своих алгоритмов и даже искусственного интеллекта. Это означает, что поисковая машина могла просканировать сеть, сайт или отдельные страницы не по причине, что ей кто-то это разрешил, а просто из-за того, что она смогла туда добраться.

Теперь поисковые машины не ждут, что им кто-то расскажет о новых страницах – они активно их ищут сами и добираются в самые дальние уголки всемирной сети и в самые дебри веб-сайтов. При этом поисковые системы исходят из принципа: всё, что не запрещено, является разрешённым для анализа. А иногда даже сканируют то, что явно закрыто от индексирования. На скриншоте письмо, которое мне прислали несколько дней назад, когда я закрыл в robots.txt часть страниц от индексирования:

Поисковые системы не только ищут ссылки на новые сайты и страницы с ранее просканированных сайтов – так было раньше. Теперь они получают информацию из нескольких, видимо, не совсем прозрачных источников. Видимо, теперь Google может узнать о странице даже если вы её просто открыли в браузере. А если на этой странице есть ссылки на другие разделы, то всё это будет просканировано и размещено в общедоступном индексе… Если на закрытую от индексации с помощью robots.txt страницу ведёт ссылка с другого сайта, то такая страница всё равно будет просканирована и добавлена в поисковый индекс.

Операторы и уточнение поисковых запросов Google

Мастерское владение поиском Гугла – это инструмент, который полезен и обычным пользователям, желающим использовать мощь этой поисковой системы для точного получения того, что они ищут; и для занимающимся расследованиями на основе открытых источников; и даже для хакеров, которые хотят собрать информацию об атакуемом сайте, либо найти уязвимые цели.

Мы рассмотрим синтаксис поисковых запросов Google, которые могут оказаться полезными для всех, что бы вы не искали. В заключительной части статьи мы рассмотрим примеры использования поиска Google для хакеров и пентестеров.

Большинство операторов можно использовать в одном запросе в комбинации с другими. Можно разнообразным образом группировать элементы запроса и с помощью скобок и логических операторов создавать очень точные запросы, которые позволяют, с одной стороны, найти необходимые страницы, и при этом исключить лишние данные.

Используя операторы можно отфильтровать документы с определённым содержимым или имеющим определённые слова в заголовке или тексте, найти чувствительную информацию, например, конфигурационные файлы и документы с паролями, а также просто – очень искусно пользоваться поиском – гуглить как профессионал.

Продвинутые операторы являются частью стандартного запроса Google. Они имеют следующий синтаксис

оператор:термин для поиска

Термин для поиска, проще говоря, это то, что нужно найти. Ещё в этой статье иногда будет использоваться фраза «ключевое слово» — это то же самое, что термин для поиска, т.е. это любое слово или фраза, которую нужно найти.

Обратите внимание, что между оператором, двоеточием и термином для поиска пробелы не ставятся.

Некоторые операторы можно комбинировать с другими, а некоторые – напротив, следует избегать использовать совместно с другими. Об этих особенностях будет говориться при описании конкретного оператора, также краткая сводка по всем поисковым операторам Гугл будет собрана в таблицу.

Google может искать по вебу, картинкам, новостям и другим областям – не все продвинутые операторы одинаково работают в каждом виде поиска. Эта информация также будет в итоговой таблице.

Расширенные возможности поиска в Гугл

Поиск по одному слову

Пример поискового запроса


обучение

Значение

Будет выполнен поиск по приведённому слову «обучение». При этом ищется не обязательно точное совпадение – в результатах могут быть слова в другом падеже, числе и так далее. Могут найтись веб-страницы, содержащие не искомое слово, а его синонимы. Результаты поиска могут быть персонализированы, то есть могут зависеть от вашего места нахождения и интересов. Например, поиск «экскурсии», вероятно, покажет экскурсии в вашем населённом пункте.

Уточнённый поиск

обучение программированию

Использование двух и более слов выведет результаты, в которых используются все слова. Т.е. между словами подразумевается логическое И. Поэтому точно такой же результат можно получить введя «обучение AND программированию». При этом необязательно ищется по точному совпадению фразы – в результатах поиска могут быть слова в другом падеже, числе, синонимы.

Поиск дословной фразы, поиск слов и выражений со специальными символами

"обучение программированию онлайн"

При использовании кавычек будет выполнен поиск по точному совпадению фразы. Также в кавычках следует указывать специальные символы, которые в противном случае будут трактоваться иначе (например, / (слэш) без кавычек будет трактоваться в поисковом запросе как пробел).

Принудительное логическое ИЛИ (поиск любого слова или фразы)

tesla OR edison

Если вам нужно логическое ИЛИ – т.е. поиск одного или другого, используйте оператор "OR". Его нужно писать заглавными буквами, также можно использовать символ трубы (|).

Обратите внимание, что в большинстве случаев Google всё равно отдаёт приоритет результатам, которые содержат оба термина. Указывать логическое OR чаще всего полезно только когда два термина встречаются редко.

Группировка слов поиска с помощью скобок

онлайн обучение (java OR php)

Некоторые операторы, включая OR, наиболее полезны в комплексных запросах. Чтобы понять этот пример, вспомним, что логическое И подразумевается по умолчанию, поэтому этот пример равнозначен записи:

онлайн AND обучение AND (java OR php)

Она означает, что обязательно должно быть слово «онлайн», обязательно должно быть слово «обучение» и обязательно должно быть одно из двух слов (или оба сразу – это не запрещено) «java» или «php».

Если бы мы пропустили скобки, т.е. записали бы выражение так:

онлайн обучение java OR php

То оно бы означало

онлайн AND обучение AND java OR php

Операторы AND имеют приоритет над OR, т.е. он выполняются в первую очередь. Таким образом, это выражение означало бы: искать фразу в которой есть все три слова «онлайн обучение java» или фразу «php» (без других уточняющих слов).

Исключение определённых слов

tesla -motors

Если вы хотите найти все сайты, на которых упоминается «tesla» и вы имеете ввиду изобретателя, и вам не нужны сайты о Tesla Motors. Для этого можно использовать знак минус (), чтобы Google исключила любые результаты со словом «motors».

Между минусом и словом не должно быть пробела.

Исключение нескольких слов из поиска

Можно указать несколько слов с минусами. Аналогично как с положительными ключевыми словами, можно в одну цель объединить несколько негативных ключевых слов:

онлайн обучение -java -php -javascipt

Помните, что каждый знак минуса должен быть в паре с одним ключевым словом или оператором.


Исключение точной фразы

tesla -motors -"rock n roll"

Вы можете исключить всю фразу из нескольких слов, используя знак минус (), за которым следует фраза в кавычках.

Если нужно, вы можете комбинировать отдельные негативные слова с негативными точно совпавшими фразами (использовать фразы и с кавычками и без в одном поисковом запросе).

Совпадение в общих чертах, использование подстановочного символа

tesla -motors "rock * roll"

Если вы хотите больше узнать об ансамбле с именем tesla, но вам не важно, как именно пишется "rock-n-roll", "rock and roll", "rock & roll" или как-то ещё, то вы можете использовать звёздочку (*), которая является подстановочным символом для любого единичного слова.

Подстановочные символы ведут себя более предсказуемо внутри точно совпадающей фразы (при использовании кавычек), позволяя вам найти примерно совпадающее, когда вы не можете свести ваш поисковый запрос к одной фразе. Подстановочный символ (*) работает только на уровне слов. При поиске в Google нет подстановочного символа, который обозначал бы любой единичный символ.

Поиск слов рядом друг с другом

тесла AROUND(3) эдисон

Если вам нужно найти слова, которые не просто присутствуют в одном документе, а стоят рядом друг с другом, то используйте оператор AROUND(X). Он говорит Google возвращать только результаты, где два слова внутри X слов друг от друга.

Фразы вроде "Тесла против Эдисона" показаны как совпавшие, в то время как статьи, где оба человека упоминаются в разных параграфах, не попадут в результат поиска.

Поиск стоящих рядом точно совпадающих фраз

"nikola tesla" AROUND(2) "thomas alva edison"

Вы можете искать по точно совпадающим фразам, стоящим в пределах определённого диапазона. Для этого комбинируйте AROUND(X) с точно совпадающими фразами (в кавычках).

AROUND(X) только работает с элементами немедленно стоящими перед или после этого оператора, поэтому осторожно используйте его когда комбинируете с другими операторами или фразами, которые не являются точным совпадением.

Обратите внимание, что AROUND(0) возвращает странные результаты – если вы хотите получить список только тех страниц, где два слова стоят вместе, используйте вместо него точное совпадение фразы (кавычки).

Поиск по определённому сайту

Если нам нужно выполнить поиск только по одному сайту, то это можно сделать так:

site:vasexperts.ru pdf

В результате будут показаны все упоминания pdf на сайте vasexperts.ru.

Оператор "site:" – это продвинутая команда, которая позволяет вам указать определённый домен, по которому вы хотите выполнить поиск.


"site:" можно использовать с корневым доменом и субдоменами. Оператор "site:" можно комбинировать с другими операторами и ключевыми словами.

Поиск по сайту hackware.ru всех статей, где упоминается yandex

site:hackware.ru yandex

Поиск содержимого по определённым доменам верхнего уровня

Поиск по всем сайтам .edu документа, содержащего «linux administration pdf»:

site:".edu" linux administration pdf

С "site:" вам необязательно писать домен целиком. Например, допустим вы хотите найти любой контент с уроками о sqli на университетских веб сайтах. Для этого укажите домен верхнего уровня ".edu":

site:".edu" sqli lesson

Оператор "site:" не работает с частичным именем домена. Он только принимает полные доменные имена, субдомены, корневые домены или домены верхнего уровня (TLD). Вы можете использовать домены верхнего уровня для определённых стран "co.uk", "com.sg" или ".ru".

Поиск материала на нескольких доменах верхнего уровня

nikola tesla (site:gov OR site:edu)

Как и ключевые слова, вы можете комбинировать операторы "site:" с логическим OR для поиска по доменам нескольких групп.

Часто проще и менее путанными являются индивидуальные поиски, но этот пример просто для иллюстрации, что вы можете использовать одновременно несколько продвинутых операторов, создавая сложные выражения поиска.

Поиск по синонимам и примерным значениям

Google понимает смысл вашего запроса и делает поиск не столько исходя из точного совпадения, также в результаты поиска содержат тексты с синонимами. Из-за этого результат может быть слишком расплывчатым. Нужно помнить об этой особенности – по умолчанию поиск выполняется по синонимам, словам в разной форме, разном падеже.

Использование точного совпадения для блокировки синонимов

"discount airfare"

Это другая ситуация, когда может помочь точное совпадение. Оно не просто говорит Google найти всю фразу, но также избегает широких совпадений любого рода, включая синонимы.

Очевидно, что результаты всё равно могут содержать синонимы (это нормально для естественно написанного контента), но использование точного совпадения гарантирует, что там будет хотя бы одно вхождение "discount airfare" в каждом из результатов поиска.

Точное совпадение одного слова

недорогой "перелёт"

На первый взгляд это может показаться лишним, но вы можете применить точное совпадение для одного слова. В этом случае Google не будет возвращать результаты с синонимами только для одного слова.

То есть слово «недорогой» Google будет искать в разных формах (например, «недорогие», «недорогую», «дешёвый»), но все результаты принудительно будут иметь слово «перелёт» именно в этой форме, без «перелёты», «авиабилеты» и т.д.). Используйте точное совпадение одного слова когда вы хотите исключить варианты этого слова.

Поиск только по тексту страницы

Вторичные факторы релевантности

Если вы ищите точную фразу, которая не найдена ни на одной странице, либо результатов слишком мало, Google может показать результаты исходя из вторичного фактора релевантности. Пример: показ странице, которая не содержит искомый текст, но на который ссылается исходящая ссылка с соответствующим анкорным текстом.

В таких редких случаях вы можете использовать оператор "intext:". Это приводит к тому, что гугл ищет текст в теле документа (то, что внутри HTML тега body).

intext:"orbi vs eero vs google wifi"

Поиск всех ключевых слов в тексте

allintext: orbi eero google wifi

Что если вы хотите найти набор слов, но они не обязательно должны быть фразой с точным совпадением? Вы можете использовать отдельный для каждого слова оператор "intext:" или использовать "allintext:", который говорит Google применить "intext:" ко всем словам, следующим за оператором.

Все результаты будут иметь целевые слова в тексте тела, в различной комбинации или порядке. Будьте очень осторожны со смешиванием "allintext:" (или любых других операторов вида "allin…:") с другими командами, иначе вы можете получить неожиданные результаты. Оператор "allintext:" будет пытаться автоматически обработать всё, что следует после него.

Поиск по заголовку (имени) страницы

intitle:"tesla vs edison"

Используйте оператор "intitle:" для указания того, что ключевое слово или фраза (в кавычках) должны встретиться в заголовке документа.

Помните, что иногда Google может переписать отображаемый в результатах поиска заголовок. Поэтому вполне возможно, что в полученных результатах вы не увидите искомую фразу по той причине, что Google переписала её.

Проверка нескольких ключевых слов в заголовке

intitle:tesla intitle:vs intitle:edison

Если вы хотите найти страницы с заголовками, в которых присутствуют несколько заданных слов, но при этом не хотите ограничивать себя поиском по точному совпадению, вы можете использовать одновременно несколько операторов "intitle:" Если слов много, то запрос может получиться громоздким, к счастью, есть более простой способ…

Простой поиск нескольких слов в загловке

allintitle: tesla vs edison

Как "allintext:", существует оператор "allintitle:". Он сделает так, что будут искаться все совпадения следующих за ним ключевых слов.

Последние два поисковых запроса равнозначны. Но опять, будьте осторожны при использовании "allintitle:" с другими операторами, поскольку он будет пытаться поглотить всё, что следует за ним.

Поиск в заголовках точных фраз и отдельных слов

intitle:"top 10 facts" tesla

Оператор "intitle:" позволяет искать по точному совпадению фразы (помещённую в кавычки), а также комбинировать это с отдельными словами, которые могут быть в любом месте заголовка.

Поиск по заголовку и тексту

intitle:"top 10 facts" "nikola tesla"

Одновременно можно искать и по заголовку, и по тексту статьи. В результатах поиска будут показаны страницы, которые удовлетворяют обоим этим требованиям. Можно использовать как обычные фразы, так и точно совпадающие (как в примере выше).

Поиск по диапазонам

intitle:"top 7..9 facts" "nikola tesla"

Оператор диапазонов .. (две точки) позволяет указывать определённые диапазоны чисел. Диапазоны указываются без пробелов, т.е. цифра, затем сразу две точки, затем другая цифра.

Поиск статьи с точным названием

intitle:"Полное руководство по mod_rewrite"

Используйте оператор "intitle:" с точно совпадающим заголовком (в кавычках) чтобы найти конкретный материал.

Такую конструкцию можно использовать и при поиске заимствований с сайта.

Поиск по заголовкам, исключая сайты

intitle:"Полное руководство по mod_rewrite" -site:hackware.ru

Используйте знак минус () с оператором "site:" для исключения определённых сайтов.

Поиск уникального, точно совпадающего текста

"При синхронном варианте, перед проверкой хендшейка захват данных будет приостанавливаться" -site:hackware.ru

Другой вариант найти заимствования, либо идентичные документы – это поиск точного совпадения длинной, уникальной фразы. Также можно исключить некоторые сайты.

Поиск уникального текста только в тексте

intext:"При синхронном варианте, перед проверкой хендшейка захват данных будет приостанавливаться"

Если вы хотите полностью убедиться, что уникальный текст присутствует в теле документа, вы можете использовать оператор "intext:". Его можно использовать с операторами (и их отрицаниями), например, с site: и другими.

На самом деле, при поиске точного совпадения фразы "intext:" часто возвращает похожие результаты, как если бы искали без этого оператора. "intext:" пригодится когда вы видите странные результаты, либо хотите быть абсолютно уверенным, что поиск выполняется только по телу текста.

Отрицание "intext:" позволяет исключить лишние результаты и отбросить много лишнего в поисках, которые выполняют хакеры. Смотрите ниже пример поиска сайтов на не стандартных портах, когда отрицание "intext:" очень улучшает чистоту полученных результатов.

Поиск цитаты, в которой вы не уверены

Без труда не вынешь из пруда

Если вы ищите длинную цитату, но не уверены, правильно ли вы её помните, то можете положиться на Google – введите её без кавычек и весьма вероятно вы увидите правильный вариант.

Поиск всех страниц одного сайта. Показ индекса сайта (всех страниц)

site:hackware.ru

Вы можете искать статьи и определённые файлы на конкретном сайте, для этого используйте оператор site:

Этот оператор можно сочетать с другими, а также с поиском по точной фразе. Либо можно использовать самостоятельно — тогда будут показаны все страницы, о которых знает Google.

Поиск по всем сайтам кроме одного

sql инъекции -site:hackware.ru -site:blackarch.ru

Если вас интересуют результаты с любого сайта кроме одного или нескольких определённых, то используйте -site:

Можно указать несколько сайтов для исключения.

Поиск по определённому субдомену

tesla announcements site:wheels.blogs.nytimes.com

Помните, что вы можете использовать "site:" с полным субдоменом.

Само-собой, с помощью "-site:" вы можете также и исключить определённый субдомен.

Поиск по ключевым словам, сайту и заголовку

sql site:hackware.ru intitle:уязвимость

Вы можете сочетать различные операторы и находить именно то, что вам нужно.

Поиск похожих сайтов

related:hackware.ru

Если вы хотите найти похожие сайты, либо информацию на похожих сайтах кроме определённого, то вы можете воспользоваться оператором "related:".

Оператор "related:" просто супер, когда он срабатывает. Помните, что он работает только для определённых ниш и обычно для крупных сайтов. Между прочим, это один из редких поисковых операторов Google, который не может одновременно использоваться с другими операторами.

Поиск контента по определённому пути

pdf site:vasexperts.ru/upload

С помощью оператора "site:" можно указывать определённые пути сайта.

Помните, что это работает только для путей URL следующих непосредственно после доменного имени. Итак, как искать по тексту в других частях URL?

Поиск по «папкам» сайта

tesla announcements inurl:2018

К счастью, у Google есть оператор "inurl:", который позволяет искать по части адреса страницы.

Помните, что текст, который вы указываете в "inurl:", может появиться где угодно в URL, а не только на уровне папки.

Поиск по определённому диапазону дат

tesla announcements daterange:2458272-2458302

Если вы хотите сузить поиск до конкретного диапазона дат, то для этого есть оператор "daterange:", который, в теории, позволяет указать даты публикации.

К сожалению, в обычных органических результатах даты публикации не всегда точные, и на практике "daterange:" возвращает довольно странные результаты. Ещё вы могли обратить внимание, что используется довольно странный формат даты. Оператор "daterange:" используют Юлианский формат даты.

Поиск по широкому диапазону дат

tesla announcement 2015..2017

Если вам не нужна особая точность в диапазоне дат, используйте оператор диапазона .. (двоеточие) с годами. Годы, как правило, достаточно уникальны, чтобы результаты были довольно релевантными.

Обратите внимание, что это не специальный поиск по дате, это что-то вроде хитрости. К сожалению, оператор диапазона не всегда правильно работает в паре с "inurl:" и другими продвинутыми операторами.

Поиск по файлам определённого типа

"информационная безопасность" filetype:pdf

Оператор "filetype:" позволяет указать расширение файла, например, PDF. В предыдущем примере нас интересуют поиск PDF файлов, содержащие точную фразу "информационная безопасность".

Оператор "filetype:" позволяет указывать различные типы файлов. Вы можете также попробовать "doc", "docx", "rtf" (Word), "xls", "xlsx" (Excel), "ppt", "pptx" (PowerPoint), и "txt" (текстовые файлы). Ещё можно использовать "filetype:" для указания определённых вариантов веб-страниц, включая "html", "htm", "php", "asp" и т.д. Имейте в виду, что расширение файла обычно должно указываться в URL-адресе, поэтому эти запросы не являются исчерпывающими.

Поиск ссылок – оператор "link:"

С 2017 оператор "link:" является устаревшим. Теперь Google трактует "link" как слово для поиска и просто ищет совпадения.

Поиск внутри текста анкора

inanchor:"tesla announcements"

Вы можете использовать оператор "inanchor:" для поиска внутри текста ссылки. Например, приведённый выше поисковый запрос ищет сайты, на которые дана ссылка с сайтов с использованием фразы "tesla announcements" в тексте ссылки.

Помните, что оператор "inanchor:" представляет только небольшую выборку индекса и больше активно не поддерживается Google.

Поиск нескольких слов в тексте анкора

allinanchor: tesla announcements "model x"

Как и все другие вариации "allin…", "allinanchor:" применяется к каждому слову после него, выполняя поиск всех этих слов в тексте анкора, но не как точное соответствие.

Операторы для поиска по анкорам ("inanchor:", "allinanchor:") могут быть полезны для ваших начальных исследований, но не ждите от них полной, точной репрезентативности всех ссылок на ваш сайт или на сайты ваших конкурентов.

Фильтрация субдомена "www"

site:offensive-security.com -inurl:www

Для углубления в индекс сайта, комбинация "site:" с "inurl:" быстро станут вашими лучшими друзьями. Например, может быть вы ходите увидеть страницы, которые не входят в субдомен "www". Вы можете использовать "site:" вместе с негативным совпадением оператора "inurl:":

Если в качестве канонического имени (то, как адрес выглядит по умолчанию) выбрана версия с www, то вы быстро увидите новые субдомены (если они есть). Это может послужить хорошей отправной точкой для последующего углубления в изучение структуры сайта.

site:fsb.ru -inurl:www

Отфильтровка нескольких субдоменов

site:amazon.com -inurl:www -inurl:logistics -inurl:developer -inurl:kdp

Вы можете довольно сильно расширить эту концепцию, последовательно ограничивая поиска исключая всё новые домены.

Можно использовать десятки выражений с "inurl:" – неизвестно, есть ли какие-либо ограничение на их количество, но большинству сайтов в любом случае не потребуется так много. Просто помните об этом на тот случай, если вам это понадобится.

Поиск по одному субдомену

site:cooi.fsb.ru

Вы можете сфокусироваться на одном субдомене. Для поиска по одному поддомену предпочтительнее использовать оператор "site:". Посколкьу использование "site:" может найти текст в любом месте URL.

Вы можете расширить эту концепцию, ища одновременно и по субдоменам и по папкам.

site:en.kali.tools/all

Фильтр небезопасных страниц

site:amazon.com -inurl:https

Что интересно, вы можете использовать "inurl:" для включения или исключения из результатов безопасных (https:) страниц.

Если вы переводите сайт с "http:" на "https:" эта хитрость может вам помочь убедиться, что новые страницы проиндексированы должным образом и старые страницы постепенно исчезают из индекса.

Поиск по URL параметру

site:amazon.com inurl:field-keywords

Вы можете использовать "inurl:" чтобы нацелиться на URL параметр динамической страницы.

Помните, что нет способа указать именно URL параметр – Google может найти текст в любой части URL. Но хорошая новость в том, что параметрам свойственно иметь уникальные имена.

Поиск по нескольким URL атрибутам

allinurl: amazon field-keywords nikon

Так же как "allintitle:" и "allintext:" имеется оператор "allinurl:". В этом примере вы ищите внутренние страницы поиска на Amazon, которые имеют слово "Nikon" в URL:

К сожалению "allinurl:" страдает от двух проблем. Одна в том, что вы не можете надёжно совместить его с "site:", что ограничивает ваши опции. Вторая – он склонен возвращать странные результаты. В большинстве случаев рекомендуется вместо него использовать несколько "inurl:".

Поиск заблудившихся текстовых файлов

site:yandex.ru filetype:txt -inurl:robots.txt

Вас может посетить мысль, а не забыли ли вы где-нибудь на сайте файлы документов, которые могла подобрать Google. Вы можете проверить это используя комбинацию "site:" и "filetype:".

В примере исключён из результатов выдачи файл "robots.txt" (используя  "-inurl:").

Это комбо хороший способ зачистить файлы, которые случайно были оставлены на сайте.


Поиск страниц-дублей на сайте

site:amazon.com "hot wheels 20 car gift pack"

Используя оператор "site:" с точно совпадающей фразой вы можете найти дублирующие или очень похожие страницы.

Ищем дублирующие заголовки

site:amazon.com intitle:"hot wheels 20 car gift pack"

Используя "site:" плюс "intitle:" вы можете найти страницы на сайте, которые могут быть полными дубликатами.

Поиск дубликатов с исключением

site:amazon.com intitle:"hot wheels 20 car gift pack" -inurl:review -inurl:reviews

При поиске вы можете группировать разные операторы – достигая нужного уровня точности.

Поиск домена в других доменных зонах

site:hackware.* -site:hackware.ru

Это простой и быстрый способ найти зарегистрированные доменные имена в других доменных зонах (доменах верхнего уровня).

Информация о странице

info:yandex.ru

С помощью info: вы можете получить краткую информацию о странице. Для большинства сайтов просто показывается случайная цитата с интересующей страницы и её заголовок.

Поиск кешированной версии сайта

cache:hackware.ru/?p=21

Это не совсем поиск, команда cache: — это возможность посмотреть кэшированную версию сайта. Т.е. если сайт изменился за последнее время, в кэше могла сохраниться его предыдущая версия.

Полный набор операторов поиска Гугл

Поисковый термин / Оператор Цель Можно смешивать с другими операторами Может использоваться один Работает ли поиск в
Веб Картинки Видео Новости
язык
(одно слово без операторов)
Будет выполнен поиск этого слова во всех его вариантах (разные морфологические формы, синонимы и т.д.) Да Да Да Да Да Да
"язык" Одно слово в кавычках — будет выполнен поиск термина в том виде, как он написан, т.е. без поиска по синонимам, морфологическим формам. Да Да Да Да Да Да
изучение английского языка Фараз из нескольких слов — будут найдены все документы, где встречается все слова из фразы. Эти слова могут находиться в различных частях документа и различных формологических формах. Но в результатах поиска первыми идут те страницы, где эти слова находятся рядом в той же последовательности, что и в поисковом запросе и в той же форме.  Да Да Да Да Да Да
"изучение английского языка" Несколько слов, заключённые в кавычки — будет выполнен поиск точной фразы. Т.е. будут показаны страницы, где все имеются все слова, которые идут в том же порядке и в той же форме, что и поисковые запросы. В одном поисковом запросе можно использовать несколько фраз в кавычках — в этом случае будут показаны страницы, содержание все фразы. Да Да Да Да Да Да
WiFu OR PWK Использование OR (заглавными буквами), либо | (символ "труба") означает логическое ИЛИ: т.е. будут показаны страницы содержащие одно слово или другое. OR можно комбинировать с фразами в кавычках, в этом случае будут найдены страницы содержащие одну точную фразу или другую. Да Да Да Да Да Да
обучение английскому языку (онлайн OR заочно)

Группировка с помощью скобок. Если бы скобки не использовались, то есть если бы запрос был в следующем виде: обучение английскому языку онлайн OR заочно, тогда в результатах поиска были бы показаны страницы содержащие одну из двух фраз:

1) обучение английскому языку онлайн

2) заочно

Т.е. слово "заочно" было бы отделено логическим ИЛИ от другой фразы (все слова которой по соеденены логическим И, которое подразумевается по умолчанию.

Да Да Да Да Да Да
волга машина Использование знака минус () перед поисковым термином или оператором приводит к тому, что среди найденных результатов не будет страниц, содержащих слово с минусом. Да Нет Да Видимо, нет Да Да
tesla -motors "rock * roll" Звёздочка (*) является подстановочным символом и означает любое одно или более слов. Для единичного символа в данный момент аналага нет! Да Да Да Да Да Да
уязвимость AROUND(3) WordPress Поиск слов во фразе определённой длины. Т.е. можно указать максимальное расстояние между искомыми словами. Меняя цифру, можно регулировать длину подходящей фразы. Можно применять с отдельными словами и точными фразами в кавычках. Следует избегать Да Да Да Да Да
.. (две точки) Поиск по диапазону. Перед двумя точками должна стоять цифра — начало диапазона, затем без пробела следуют две точки, а затем без пробела следует окончание диапазона. Пример: 2017..2019 Да Да Да Да Да Да
site: Поиск только по определённому сайту. Пример поисковый запрос site:hackware.ru уязвимости найдёт все страницы, содержащие слово уязвимость на сайте hackware.ru. В качестве поискового термина можно указать конкретный сайт, поддомен, либо домен верхнего уровня (доменную зону). Да Да Да Да Да Да
intext: Поиск только по тексту страницы (а не по заголовкам, адресам страницы и пр.). Можно использовать с отрицанием (-), чтобы исключить результаты, содержащие поисковый термин в результатах выдачи. Да Да Да Да Да Да
allintext: Поиск только по тексту страницы, будут найдены только материалы, содержащие каждое искомое слово. На самом деле нет Да Да Да Да Да
intitle: Поиск только по заголовку, т.е. имени страницы. Да Да Да Да Да Да
allintitle: Поиск всех слов только по заголовку. Нет Да Да Да Да Да
inurl: Поиск по URL (адресу) страницы. Да Да Да Да Да Да
allinurl: Поиск по URL (адресу) страницы всех ключевых слов. Нет Да Да Да Да Да
filetype: Поиск по файлам определённого типа. Да Да Да Да Да Да
inanchor: Поиск по тексту анкора ссылки. Да Да Да Да Да Да
allinanchor: Поиск всех слов по тексту анкора ссылки. Нет Да Да Да Да Да
related: Поиск похожих сайтов Нет Да Да Да Да Да
daterange: Поиск по диапазону дат. Работает плохо, практически не применим. Да Да Да Да Да Да
info: Показывается информация о странице Нет Да Да Видимо, нет Видимо, нет Видимо, нет
cache: Показ страницы на тот момент, когда её просканировал Google последний раз.            
link: Поиск ссылок — больше не работает.            

В других руководствах и статьях могут упоминаться не перечисленные здесь операторы. Но они на данный момент либо не работают, либо обрабатываются как обычные слова.

Поиск в Google для хакеров

Гугл позволяет анализировать целевой сайт, даже не делая на него запросы. Через Гугл можно найти уязвимые сайты, а также чувствительную информацию. Рассмотрим несколько примеров хакинга с Google.

Поиск папок сайта с открытым для просмотра содержимым

Находим папки, позволяющим просматривать их содержимое, для конкретного сайта:

intitle:"index of /" Parent Directory site:yoursitehere.com

В этом примере и далее вместо yoursitehere.com впишите интересующий вас сайт.

Пример:

intitle:"index of /" site:fsb.ru

Поиск любых сайтов, которые позволяют просматривать содержимое папок:

intitle:"index of /" Parent Directory

Или так:

intitle:"index of /"

Поиск папок admin с открытым индексом

Поиск папок admin, содержимое которых можно просматривать, на конкретном сайте:

intitle:"Index of /admin" site:yoursitehere.com

Поиск любых сайтов с открытой для просмотра папкой admin:

intitle:"Index of /admin"

Поиск папок password с открытым индексом

Поиск открытых папок password на целевом сайте:

intitle:"Index of /password" site:yoursitehere.com

На любых сайтах:

intitle:"Index of /password"

Поиск директорий mail с открытым индексом

Поиск директорий mail на конкретном сайте:

intitle:"Index of /mail" site:yoursitehere.com

На любых сайтах:

intitle:"Index of /mail"

Кроме целых папок с чувствительной информацией или с открытым для просмотра индексом, можно искать файлы с чувствительной информацией.

Поиск файлов с интересной информацией, таких как passwd

На целевом сайте:

intitle:"Index of /" passwd site:yoursitehere.com

На любых сайтах:

intitle:"Index of /" passwd

Поиск файлов password.txt

Текстовые файлы доступны для скачивания, а файл с именем password.txt (пароль), может содержать учётные данные для входа. Поиск по целевому сайту:

intitle:"Index of /" password.txt site:yoursitehere.com

На любых сайтах:

intitle:"Index of /" password.txt

Поиск файла htaccess

На конкретном сайте:

intitle:"Index of /" .htaccess site:yoursitehere.com

На любых сайтах:

intitle:"Index of /" .htaccess

Поиск файлов по расширению

На сайтах могут быть забыты самые разные файлы. Причём не редки случаи, когда папки сайта могут использоваться для обмена файлами, совместного доступа к файлам. Некоторые папки могут быть частью локальной сети и не предназначены для открытого доступа, но случайно попадают в индекс, т.к. Гугл сканирует хосты в том числе по IP адресам.

Про поиск файлов с различным расширением мы ещё вернёмся позже. Ниже один из примеров поиска файлов с расширением .mdb (Microsoft Access database) на конкретном сайте:

intitle:"index of ftp" .mdb site:yoursitehere.com

На любых сайтах:

intitle:"index of ftp" .mdb

Поиск админок (страниц управления сайтом) и страниц входа

Поиск страниц, в названии которых встречаются слова "login" "admin" на конкретном сайте:

Intitle: "login" "admin" site:yoursitehere.com

Учитывайте региональные языковые особенности:

site:fsb.ru авторизация

Также для поиска панелей управления используйте inurl вместе со словами admin, login и т.п.

Поиск страниц с адресом, содержащим слово admin, на конкретном сайте:

inurl:admin site:yoursitehere.com

Пример:

inurl:admin site:mvd.ru

Поиск страниц с адресом, содержащим слово login, на конкретном сайте:

inurl:login site:yoursitehere.com

Поиск файлов

Оператор filetype позволяет искать файлы с определёнными расширениями. В зависимости от целей, вы можете искать текстовые документы, фотографии, файлы настроек, системные файлы и т.д.

Поиск текстовых файлов, содержащих слово passwd в URL на определённом сайте:

inurl:passwd filetype:txt site:yoursitehere.com

Поиск файлов db содержащих admin в URL на целевом домене:

inurl:admin filetype:db site:yoursitehere.com

Поиск логов на целевом домене

filetype:log site:yoursitehere.com

Поиск файлов Excel и csv на целевом домене:

filetype:xls csv site:yoursitehere.com

Подборка интересных расширений файлов

  • pdf – документы PDF, часто используются организациями и компаниями
  • "doc", "docx", "rtf" – эти форматы документов Word
  • "xls", "xlsx" – таблицы Excel
  • "ppt", "pptx" – презентации PowerPoint
  • "txt" – обычные текстовые файлы
  • "html", "htm", "php", "asp" – типичные для веб-страниц расширения (могут быть интересны для определения технологий, на которых работает сервер, а также для поиска разделов сайта, которые работают не под управлением основой системы управления контентом)
  • .mdb – базы данных Microsoft Access
  • .sql – файлы импорта в СУБД (могут быть бэкапом сайта, содержащим пароли и другую чувствительную информацию)
  • .odt – текстовые файлы LibreOffice и OpenOffice
  • .ods – Calc, т.е. таблицы LibreOffice
  • .odp – Impress LibreOffice
  • .odg – Draw LibreOffice
  • .csv – Разновидность файлов таблиц
  • .ibd – файлы баз данных MySQL
  • .hc – VeraCrypt
  • .7z, .rar, .tar, .zip, .gz, .bz2, .tgz, .tar.gz, .tar.bz2, .bzip2 – архивы (могут содержать резервную копию сайта и прочее)
  • .conf, .cnf, .ini – файлы конфигураций
  • .log – файлы журналов (логов)
  • .cap – файлы захвата сетевого трафика
  • .mp4, .webm, .mkv, .avi, .flv – видео файлы
  • .sh – Bash скрипты
  • .vdi, .ova – Виртуальные машины и виртуальные диски
  • .iso, .img – Образы дисков
  • .htaccess – файл настройки веб-сервера (не должен быть виден, если он попал в индекс, значит стоит обратить внимание и поискать другие чувствительные файлы)

Пример поиска:

site:fsb.ru inurl:pdf план проверок

Чтобы сократить время поиска, можно искать сразу по нескольким расширением, используйте логическое ИЛИ – OR, а также скобки:

site:site.ru (inurl:pdf OR inurl:mp4 OR inurl:avi OR inurl:log)

Можно указать много расширений, сгруппировать их, например, поиск всех документов, поиск всех архивов, поиск медиа и т.д. Благодаря таким большим конструкциям можно быстро проверить целевой сайт на наличие забытых файлов:

site:site.ru (inurl:doc OR inurl:docx OR inurl:rtf OR inurl:xls OR inurl:xlsx OR inurl:ppt OR inurl:pptx)

Поиск субдоменов

С помощью Гугл вы можете найти субдомены сайта. Это не самый быстрый способ и не самый надёжный – хорошо работает только для сайтов, имеющих в каноническом имени www, например, www.kali.org. Иногда для поиска поддоменов лучше воспользоваться предназначенными для этого программами. Но в качестве альтернативы, полезно знать об этой возможности.

Например, нас интересует сайт www.kali.org, делаем первый запрос:

site:kali.org -site:www.kali.org

Находим первые поддомены:

  • tools.kali.org
  • git.kali.org
  • forums.kali.org

Делаем следующий запрос, исключая найденные субдомены из поиска:

site:kali.org -site:www.kali.org -site:tools.kali.org -site:git.kali.org -site:forums.kali.org

Находим следующие субдомены:

  • docs.kali.org
  • cdimage.kali.org
  • pkg.kali.org
  • http.kali.org
  • security.kali.org

Также исключаем их из поиска:

site:kali.org -site:www.kali.org -site:tools.kali.org -site:git.kali.org -site:forums.kali.org -site:docs.kali.org -site:cdimage.kali.org -site:pkg.kali.org -site:http.kali.org -site:security.kali.org

Вновь находим новые субдомены:

  • archive-4.kali.org
  • archive-7.kali.org
  • archive.kali.org
  • archive-3.kali.org
  • old.kali.org

И вновь исключаем их из поиска:

site:kali.org -site:www.kali.org -site:tools.kali.org -site:git.kali.org -site:forums.kali.org -site:docs.kali.org -site:cdimage.kali.org -site:pkg.kali.org -site:http.kali.org -site:security.kali.org -site:archive-4.kali.org -site:archive-7.kali.org -site:archive.kali.org -site:archive-3.kali.org -site:old.kali.org

Находим последние (из тех, о которых знает Google) субдомены:

  • archive-10.kali.org
  • archive-2.kali.org

Убеждаемся, что больше поддоменов нет:

site:kali.org -site:www.kali.org -site:tools.kali.org -site:git.kali.org -site:forums.kali.org -site:docs.kali.org -site:cdimage.kali.org -site:pkg.kali.org -site:http.kali.org -site:security.kali.org -site:archive-4.kali.org -site:archive-7.kali.org -site:archive.kali.org -site:archive-3.kali.org -site:old.kali.org -site:archive-10.kali.org -site:archive-2.kali.org

Преимущество такого способа перебора субдоменов:

  • мы не выдали себя – цель не может знать о нашей активности
  • результат отранжирован Гуглом – самые публичные вещи наверху, самые «интересные» болтаются внизу
  • поскольку здесь данные ассимилированы из нескольких источников, мы можем найти что-то интересное

Поиск хостов на определённых портах

С помощью inurl: вы можете искать сайты, хосты, использующие определённые порты. Чтобы сократить количество ложных результатов, можно указывать имя службы на этом порту:

inurl:10000 webmin

Более точные результаты можно получить используя inurl: в паре с отрицанием поиска по тексту -intext:

inurl:8080 -intext:8080

Пример — поиск роутеров D-Link:

inurl:8080 intitle:"D-LINK SYSTEMS"

Поиск ошибок баз данных

Поиск по типичным ошибкам баз данных позволял найти сайты с различными СУБД и даже сайты, уязвимые, например, к SQL-инъекции.

Видимо, сейчас Гугл исключает из поисковой выдачи страницы, на которые попала ошибка. В поисковой выдаче присутствуют бесконечные форумы с решением одной и той же проблемы…

Всё-таки, кое-что интересное ещё можно найти.

Поиск дампов баз данных

"# Dumping data for table"

Добавьте username, password, admin и тому подобное, чтобы было ещё интереснее.

Поиск паролей подключения к базам данных

filetype:inc intext:mysql_connect

В этом примере мы ищем файлы с расширением .inc. Это частое название файлов для инклуда (включения) в код. В этих файлах мы ищем текст mysql_connect – код подключения к базе данных. Т.е. мы ищем файлы с исходным кодом, в которых присутствует подключение к СУБД, требующее пароль. Соответственно, мы можем найти файлы с паролями системы управления базами данных MySQL.

Подключиться к MySQL можно разными способами – даже в PHP есть несколько расширений для этого. Поэтому возможно много разных вариантов, например:

filetype:inc intext:"new mysqli"

или

filetype:inc intext:"mysqli_init();"

или

filetype:inc intext:"= new PDO("

 или

filetype:inc intext:"->db_connect();"

Поиск конфигурационных файлов:

intext:DB_PASSWORD filetype:env

Также следует поэкспериментировать с типом файла: попробуйте .txt, .php и так далее.

Поиск паролей в дампах баз данных

В SQL синтаксисе при создании пользователя базы данных используется примерно следующая конструкция:

CREATE USER 'user'@'host' IDENTIFIED BY 'password';

После IDENTIFIED BY идёт пароль пользователя. Для поиска дампов, в которых может быть пароль:

filetype:sql "Identified by" -csv

Ещё один вариант на основе альтернативного синтаксиса:

filetype:sql "Identified by" ("Grant * on *" | "create user")

Поиск конфигурационных файлов OpenVPN

Используя эти файлы, можно подключаться к чужим OpenVPN серверам:

filetype:ovpn

Поиск FTP серверов:

inurl:ftp:// "Index of"

Поиск сертификатов сайтов

inurl:/wp-includes/certificates/

Поиск исходного кода с паролями

"pwd=" "UID=" ext:inc

Это только один из множества примеров – используйте свою креативность. Расширения файлов могут быть разными.

Поиск документов с паролями

(filetype:xls OR filetype:xlsx) inurl:password

Обратите внимание, что используется логическое ИЛИ – OR, а также скобки. Таким образом, ищутся файлы с расширением xls или xlsx, которые в адресе файла содержат слово password.

Можно поискать в файлах различных типов:

(filetype:odt OR filetype:doc OR filetype:docx) inurl:password

Поиск ключей входа SSH

Брут-форс, уязвимости, социальная инженерия? Хватит мучиться! Просто бери ключи от сервера:

intitle:"Index of" id_dsa

Поиск веб-камер

Продавайте телевизор – если вам захочется что-то посмотреть, вы надолго сможете себя занять. Количество камер доступных для свободного доступа очень велико. Также очень велико количество дорков для их поиска. Всего несколько примеров:

  • inurl:/view/viewer_index.shtml
  • inurl:jpegpull.htm
  • inurl:"mjpg/video.cgi?resolution="
  • inurl:control/camerainfo
  • intitle:"webcamXP 5" -download
  • inurl:/mjpg/video.mjpg

Компактный формат записи альтернатив

Этот дорк ищет FTP с открытым листингом файлов. Главное, обратите внимание как записаны альтернативы filetype – оказывается, их не нужно писать множество раз. Используя такой формат можно значительно уменьшить размер запроса и сделать его более читаемым:

inurl:~/ftp://193 filetype:(php | txt | html | asp | xml | cnf | sh) ~'/html'

Google Hacking Database (GHDB)

Пора остановиться просто потому, что где-то должен быть конец.

Практически неиссякаемый поток примеров поиска уязвимых сайтов: https://www.exploit-db.com/google-hacking-database/

Для поиска вы можете выбрать одну из подкатегорий:

Any Category – Любая категория

  • Footholds – Плацдармы
  • Files Containing Usernames – Файлы, содержащие имена пользователей
  • Sensitive Directories – Чувствительные директории
  • Web Server Detection – Обнаружение веб-серверов
  • Vulnerable Files – Уязвимые файлы
  • Vulnerable Servers – Уязвимые сервера
  • Error Messages – Сообщения об ошибках
  • Files Containing Juicy Info – Файлы, содержащие сочную информацию
  • Files Containing Passwords – Файлы, содержащие пароли
  • Sensitive Online Shopping Info – Чувствительная информация онлайн магазинов
  • Network or Vulnerability Data – Данные о сети или уязвимости
  • Pages Containing Login Portals – Страницы входа
  • Various Online Devices – Различные онлайн устройства
  • Advisories and Vulnerabilities – Рекомендации и уязвимости

Google Dorks

Большая подборка интересных дорков Гугл: https://kali.tools/files/dorks/google.txt

Использование Гугл для анонимного просмотра сайтов

Google Translater можно использовать как анонимный прокси для доступа к веб-сайту:

http://translate.google.com/translate?hl=ru&sl=sq&tl=ru&u=hackware.ru

Вместо hackware.ru вставьте адрес страницы, которую вы хотите посмотреть.

Внимание! Я не анализировал, откуда подгружаются изображения – вполне возможно, что с самого сайта, а не с кэша. Помните об этом!

Ещё один вариант – использовать оператор cache:

cache:hackware.ru

Опять же помните, что изображения могут подгружаться с самого сайта! В книге Johnny Long. Google Hacking for Penetration Testers пишут, что так и есть – изображения грузятся из исходного сервера. Чтобы этого не происходило, нужно добавить &strip=1 к концу кэшированного URL, чтобы Google показала только текст и ничего не подгружалось с исходного сервера. Опять же – я это не проверял, а сама книга во многом устарела – помните об этом и анализируйте трафик самостоятельно.

Источники:

  1. https://moz.com/blog/mastering-google-search-operators-in-67-steps
  2. Johnny Long. Google Hacking for Penetration Testers
  3. http://securityidiots.com/Web-Pentest/Information-Gathering/Part-2-information-Gathering-with-Google.html
  4. https://support.google.com/websearch/answer/2466433?hl=ru

Читайте также «Продвинутый поиск в Яндекс».


Рекомендуется Вам:

4 комментария to Продвинутый поиск в Гугл

  1. Алексей:

    Здравствуйте, а как добавить поиск по двум определенным сайтам в гугл расширенный поиск?

    • Alexey:

      Для поиска сразу по двум (или более) сайтам используйте конструкцию:

      (site:САЙТ1 OR site:САЙТ2 OR site:САЙТ3) ФРАЗА ДЛЯ ПОИСКА

      Например, для одновременно поиска по сайтам hackware.ru и zalinux.ru слова «mysql»: (site:hackware.ru OR site:zalinux.ru) mysql

      Не забывайте скобки, иначе фокус не удастся!

  2. demimurych:

    Использование двух и более слов выведет результаты, в которых используются все слова. Т.е. между словами подразумевается логическое И. Поэтому точно такой же результат можно получить введя «обучение AND программированию». При этом необязательно ищется по точному совпадению фразы – в результатах поиска могут быть слова в другом падеже, числе, синонимы.

    Поиск фразы никогда не был эквивалентом того же запроса с ипользованием оператора AND.

    Это прицнипиально разные запросы. В чем легко убедиться даже не понимая приницпа просто вбив их в поиск.

    Фраза — это смысловая сущность. Поиск пытается искать релевантные страницы отталкиваясь от этого.

    Слова через AND это разные смысловые сущности, которые должны быть учтены в поиске релевантной страницы.

     

     

    • Alexey:

      Приветствую! Ваша мысль понятна. Результаты с AND и без действительно различаются, но несильно — в выдаче примерно те же самые сайты, но на второстепенных позициях порядок может быть чуть другим.

      Если AND работает как вы пишите, то получается, что в практике AND можно применять как запятую в условной фразе «казнить нельзя помиловать».

Добавить комментарий для Алексей Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *