С совершенствованием систем поиска информации в Интернете все чаще и чаще в их базы данных попадают конфиденциальные данные. Эта проблема далеко не нова, поскольку даже несколько лет назад роботы поисковых систем вносили в поисковые базы данных все доступные им страницы, в том числе и те, на которых по неосторожности или из-за программных ошибок оказывались данные, не предназначенные для публики.
Однако в последнее время в поисковые движки, например в самую популярную поисковую систему Google, начали внедряться механизмы поиска информации не только на веб-страницах, но и в файлах других типов. Так, уже упомянутая Google с недавних пор умеет искать информацию в файлах форматов Adobe PostScript; Lotus 1-2-3 и WordPro; MacWrite; Microsoft Excel, PowerPoint, Word, Works и Write; а также .rtf. С запуском этой системы владельцы многих сайтов обнаружили, что в результатах поиска Google стали появляться документы, содержащие в том числе конфиденциальную информацию, и вынуждены были принять дополнительные меры по защите данных.
Официально Google снимает с себя ответственность за возможное разглашение закрытых данных, но в то же время разрабатывает меры по "отлову" таких файлов, до того, как они появятся в поисковой базе данных.
Кроме этого, эксперты по безопасности опасаются, что пользование поиском среди файлов разных форматов, может повысить угрозу вирусного заражения компьютера. Так, документы Microsoft Office, по умолчанию открываемые в "родной" программе могут содержать макровирусы. Этой опасности в случае Google можно избежать, выбрав опцию "View HTML".