www.Googleinurl.blogspot.com |
[Operadores Avançados] - Utilizando Google com
eficiência!!!
Esse texto apresenta uma série de técnicas utilizáveis na maior das máquinas de busca, o
Google. Entretanto, ainda que exista um domínio do Google para pesquisas em páginas
exclusivamente em português e brasileiras, as principais funcionalidades e aplicações
ainda não foram incorporadas na versão www.google.com.br
Assim, o texto torna-se útil principalmente para aqueles que já estão familiarizados com
a utilização da máquina e seus padrões originais, no www.google.com (sem ponto bê
érre).
Como utilizar o Google
com eficiência
Por: Sudar Muthu
Tradução de Moreno Barros
O básico do Google
A Internet é uma vasta coleção de informação escondida em mais de 2 bilhões de
páginas. Mas o volume crescente de conteúdo torna difícil encontrar informações
pertinentes a um assunto desejado. Pesquisar na internet é como procurar uma agulha
em uma palheiro. As máquinas de buscas surgiram, para auxílio. Elas evoluiram rápido,
tentando cercar todas as nuances de bilhões de documentos online, e ainda continuam a
evoluir hoje.
Google entrou na roda em 1998. Sua página principal é ilusoriamente simples com um
campo de preenchimento para busca, e alguns botões. A interface básica tão fascinante
em sua simplicidade desmente o poder da máquina do Google por baixo, e a riqueza de
informações a sua disposição. E se você utiliza a sintaxe de busca do Google em sua
plenitude, a Web é a sua ostra. Nesse artigo você encontrará técnicas que irão lhe
auxiliar no uso das ferramentas do Google com eficiência.
Busca textual
O básico das Booleanas.
Sempre que você pesquisar por duas (ou mais) palavras chave de uma só vez, as
máquinas de buscas utilizam um método padronizado para lidar com essas palavras.
Deve a máquina pesquisar pelas duas palavras separadamente ou juntas? A resposta se
chama padrão Booleano; as máquinas de busca podem padronizar as booleanas AND
(pesquisará pelas duas palavras juntas) ou a booleana OR (pesquisará pelas duas
palavras separadamente). Claro, mesmo que o padrão de uma máquina de busca seja
pesquisar pelas duas palavras juntas (AND) você poderá utilizar um comando especial
para instruir a pesquisa pelas palavras separadamente (OR).
O padrão booleano do Google é AND; isso significa que se você pesquisar por duas ou
mais palavras, o Google vai pesquisar por todas elas. Se você pesquisar por:
Operadoras de telefones celulares
o Google pesquisará por todas as três palavras (desconsiderando os artigos e
preposições). Se você quer especificar que qualquer uma das palavras é aceitável, você
pode colocar um OR entre elas: Operadoras OR telefones OR celulares
Se você quer definitivamente um termo, e um ou dois mais outros termos aceitáveis (ou
termos não definitivos), você pode agrupá-los dentro de parentese, assim: Operadoras
(Vivo OR Claro OR Oi)
Essa frase busca pela palavra "Vivo" ou "Claro" ou "Oi" juntamente com a palavra
"Operadoras". Outro caracter que pode ser utilizado em substituição ao OR é a função |
do teclado, como em: Operadoras (TIM | "telefones celulares")
Se você quer especificar que um item de busca não deve aparecer nos seus resultados,
utilize um - (sinal de menos). Operadoras de telefones celulares - Vivo
Essa frase vai pesquisar por páginas que contenham tanto as palavras "operadoras",
"telefones" e "celulares", mas não a palavra "Vivo".
As sintaxes especiais
Em adição ao básico AND, OR e palavras entre aspas, o Google oferece algumas
sintaxes especiais para otimização das buscas de seus usuários.O Google sendo uma
máquina de busca de textos completos, indexa páginas da Web integralmente ao invés
de apenas títulos e descrições. Comandos adicionais, chamados de sintaxes especiais,
permitem que os usuários do Google busquem por partes específicas de páginas da
Web, ou específicos tipos de informação. Isso é vantajoso quando você está lidando
com 2 bilhões de páginas e precisa de todas as oportunidades para melhorar os
resultados de sua busca. Especificar que suas palavras chave para a pesquisa devem
aparecer apenas no título ou URL de uma página encontrada é uma grande maneira de
otimizar seus resultados sem ter que tornar suas palavras chaves propriamente muito
específicas.
Eis algumas das palavras chaves comuns que você pode adicionar a sua pesquisa no
Google.
intitle:
Restringe sua busca a títulos de páginas da Web. A variação, allintitle: encontra
páginas onde todas as palavras especificadas constituem o título da página. Mas é
melhor evitar o uso da variação allintitle: , porque não combina muito bem com
algumas das outras sintaxes.
Exemplo:
intitle:"Roberto Jefferson"
allintitle:"cpi mista" dos correios
inurl:
Restringe sua pesquisa as URLs das páginas. Essa sintaxe costuma funcionar bem para
encontrar páginas de busca e de ajuda, porque tende a ser regular em suas composições.
Uma variação allinurl: encontra todas as palavras listadas em um URL, mas também
não funciona muito bem com outras sintaxes especiais.
Exemplo:
inurl:ajuda
allinurl:pesquisa ajuda
intext:
Pesquisa apenas o conteúdo textual (ignora links, URLs e títulos). Existe uma variação
allintext: mas novamente, não gosta muito de brincar com as outras sintaxes. Apesar de
seu uso ser limitado, é perfeito para encontrar palavras chave que poderiam ser muito
comuns em URLs ou links de títulos.
Exemplo:
intext:"yahoo.com"
intext:html
inanchor:
Pesquisa por texto nas âncoras dos links de uma página. Uma âncora de link é o texto
descritivo desse link. Por exemplo, o âncora do link no código HTML é "ExtraLibris
Tecnológica".
Exemplo:
inanchor:"Elio Gaspari"
site:
Permite que você limite sua pesquisa tanto por domínio de um site ou domínio de nível
elevado. AltaVista, por exemplo, possui duas sintaxes para essa função (host: e
domain:), mas o Google possui apenas um.
Exemplo:
site:extralibris.info
site:moreno.extralibris.info
site:gov
site:bn.br
link:
Retorna uma lista de páginas que fazem ligação a uma URL especificada. Digite
link:www.google.com e você receberá uma lista de páginas que fazem link ao Google.
Não se preocupe em incluir o http:// ; não é necessário, e na verdade, o Google parece
ignorá-lo mesmo que você insira. link: funciona também com URLs extensas -
http://www.oglobo.com.br/segundocaderno ... ldojabour/ por exemplo ? bem como com
URLs de nível elevado, como globo.com.
Exemplo:
link:www.google.com
cache:
Encontra uma cópia da página que o Google indexou mesmo se essa página não se
encontra mais disponível em sua URL original ou modificou completamente seu
conteúdo desde então. Isso é particularmente útil para páginas que se modificam com
frequência. Se o Google retornar um resultado que aparentemente não tem muito a ver
com a sua busca, você quase que certamente encontrará o que está procurando na última
versão em cache dessa página no Google.
Exemplo:
cache:www.yahoo.com
daterange:
Limita sua pesquisa em uma data particular ou variação de datas em que uma página foi
indexada. É importante notar que a busca não é limitada a data de criação da página e
sim quando foi indexada pelo Google. Então se uma página foi criada em 2 de fevereiro
e não indexada pelo Google antes de 11 de abril, poderá ser encontrada com daterange:
busca em 11 de abril. Note que o daterange: funciona com datas Julianas e não
Gregorianas (as que utilizamos no dia-dia).
Exemplo:
"George Bush" daterange:2452389-2452389
neurocirurgia daterange:2452389-2452389
filetype:
Pesquisa os sufixos ou extensões de nomes de arquivos. Esses são geralmente, mas não
necessariamente, diferentes tipos de arquivos. Eu prefiro fazer essa distinção, porque
pesquisar pelo filetype:htm e filetype:html fornece diferentes números de resultados,
apesar de serem o mesmo tipo de arquivo. Você pode pesquisar por diferentes geradores
de páginas, como ASP, PHP, CGI, e daí por diante ? presumindo que o site não está
escondendo arquivos por trás de redirecionamentos e proxy. O Google indexa diversos
formatos diferentes da Microsoft, incluindo: PowerPoint (PPT), Excel (XLS), and Word
(DOC).
Exemplo:
artigos filetype:pdf
"indicadores econômicos" filetype:ppt
related:
Encontra páginas que estão relacionadas com a página especificada. Nem todas as
páginas são relacionadas a outras páginas. Essa é uma boa maneira de encontrar
categorias de páginas; uma busca por related:google.com retorna uma variedade de
máquinas de busca, incluindoHotBot, Yahoo!, e Northern Light.
Exemplo:
related:www.yahoo.com
related:www.cnn.com
info:
Fornece uma página de links contendo mais informações sobre uma URL especificada.
Inclui um link para o cachê da URL, uma lista de páginas que fazem ligação aquela
URL, páginas que são relacionadas aquela URL, e páginas que contêm a URL. Note que
essa informação é dependente das indexações do Google. Se o Google não indexou essa
URL, informação obviamente será reduzida.
Exemplo:
info:www.biblio.crube.net
info:www.uol.com.br/musica
Encontrando a
terminologia tecnológica
Vocabulários especializados permanecem, na maioria dos casos, como palavras
estáticas que normalmente não modificam seus significados de uma hora pra outra. Isso
não se aplica aos jargões relacionados à computação. Parece que a cada 12 segundos
alguém aparece com um termo novo relacionado a computadores ou Internet, e então 12
minutos depois se torna obsoleto ou significa algo completamente diferente ?
geralmente mais de uma coisa ao mesmo tempo. Talvez não seja tão mau assim. Apenas
sentimos dessa maneira. O Google pode te ajudar em duas maneiras; ajudando a
encontrar palavras e ajudando a encontrar as palavras que você não conhece, mas que
precisa conhecer.
Começando pelo começo: pelamordedeus, não coloque simplesmente a abreviação
dentro do campo de busca! Por exemplo, se você pesquisa por XSLT, receberá 900.000
resultados em troca. Utilizando combinações que o Google fornece, pode-se descobrir
que existe muito mais vida do que isso. Ao invés, adicione "stands +for" [?significa?] ao
campo de pesquisa se o que você procura é uma abreviação ou acrônimo. "XSLT stands
+for" [?XSLT significa?] retorna mais ou menos 29 resultados, e o primeira da lista é
um glossário tutorial. Se você ainda está recebendo muitos resultados ("XML stands
+for" fornece 1,000 resultados) tente adicionar ?beginners? [?iniciantes?] , que retorna
35 resultados, o primeiro sendo "XML for beginners" [?XML para iniciantes]. Se ainda
assim você não está conseguindo os resultados desejáveis, tente "What is X?" [?O que é
X??] ou "X +is short +for" [?X + é redução + de?] ou X beginners FAQ, onde X é o
acrônimo ou termo.
Esses devem ser considerados métodos de segundo-escalão, porque muitos sites tendem
a não utilizar frases tipo "What is X?" em suas páginas. "X is short for" é linguagem
incomum, e X pode ser tão novo (ou tão obscuro) que ainda não possui uma entrada
FAQ. Novamente, seus resultados podem variar e vale a pena arriscar; existe muita
terminologia por aí. Se você possui terminologia específica de hardware- ou software ?
tente a palavra ou frase junto com quaisquer coisas que você conhece sobre sua
utilização. Por exemplo, DynaLoader é uma terminologia específica de software; é um
módulo Perl. Sabendo isso, apenas dê às duas palavras uma combinação: DynaLoader
Perl. Se os resultados que você encontrar forem muito avançados, assumindo que você
já sabe o que DynaLoader é, comece a brincar com as palavras ?beginners?, ?newbie?
[?novato?], e similares para lhe aproximar a informações para iniciantes:
DynaLoader Perl Beginners
Google Groups
Os grupos da Usenet, grupos de discussão com base textual cobrindo literalmente
centenas de milhares de assunto, existem desde antes mesmo a criação da World Wide
Web. E agora eles estão disponíveis para busca e utilização como o
(http://groups.google.com/). O arquivo do Google Groups começa em 1981 e cobre até
os dias de hoje. Mais de 200 milhões de mensagens estão arquivadas. Como você pode
imaginar, é um arquivo bem grande, cobrindo literalmente décadas de discussão. Se
perdeu em uma fase de um jogo de vídeo-game das antigas? Precisa de ajuda com uma
máquina de costura que comprou em 1982? Você pode encontrar respostas aqui. Google
Groups também permite que você participe das discussões da Usenet.
Existem hierarquias regionais e menores, mas as principais são: alt, biz, comp,
humanities, misc, news, rec, sci, soc, e talk. Muitos dos grupos da Web são criados
através de um processo de votação e são colocados sob hierarquias que mais se aplicam
ao tópico.
Navegando pelos grupos
Na página principal do Google Groups, você pode navegar por uma lista de grupos
escolhendo uma hierarquia na página principal. Você verá que existem subtópicos, sub-
subtópicos, sub-sub-subtópicos e ? bom, você já entendeu. Por exemplo, na hierarquia
comp (computadores) você encontrará subtópico comp.sys, redução de ?computer
systems?. Sob ele existem 75 grupos e subtópicos, incluindo comp.sys.mac, uma parte
da hierarquia devotada ao sistema de computador Macintosh. Existem 24 subtópicos
Mac, um deles comp.sys.mac.hardware, que possui, além, 3 grupos abaixo. Quando
você já tiver trilhado todos os grupos específicos de seus interesses, o Google Groups
apresenta as mensagens propriamente, sortidas em ordem cronológica inversa. Essa
estratégia funciona bem quando você quer ler um grupo lento (baixo tráfego) ou
moderado, mas quando você quer ler um grupo volumoso, livre-para-qualquer-usuário,
você pode desejar utilizar a máquina de busca do Google Groups. A busca na página
principal funciona similarmente à pesquisa regular no Google; a única diferença
perceptível é o botão do Google Groups e cada resultado possui um grupo associado e
data de postagem.
Sintaxes especiais e Google Groups.
Você pode fazer pesquisas precisas na página de buscas avançadas do Google Groups.
E, como no Google regular, você possui algumas sintaxes a sua disposição. Google
Groups é um arquivo de conversações. Então, quando você pesquisar, você obterá mais
sucesso se tentar procurar por linguagem informal e de conversação, não a linguagem
cuidadosamente estruturada que encontra em sites da Internet (bom, pelo menos alguns
sites...)
intitle:
Pesquisa por palavras nos títulos de mensagens.
Exemplo:
intitle:futebol
group:
Restringe sua busca a um grupo específico ou conjunto de grupos (tópico). O caracter *
(asterisco) modifica uma sintaxe group: para incluir tudo sob o grupo ou assunto
especificado. comp.lang* [comp lang de computer language, ?linguagem
computacional? em Português] encontrará resultados no grupo comp.lang, bem como
em comp.lang.php, comp.lang.perl, e em diante.
Exemplo:
group:comp.lang*
group:alt*
group:comp.lang.perl.misc
author:
Especifica o autor de uma mensagem no grupo. Pode ser nome completo ou parcial, ou
um endereço de email.
Exemplo:
Eg: author:fred
author:fred flintstone
author:flintstone@bedrock.gov
Google Images
Tire uma folga da busca textual e dê uma olhada no Google Images
(http://images.google.com/), um índice com mais de 390 milhões de imagens
disponíveis na Web. A busca de imagens do Google começa com uma busca simples
por palavras chave. Imagens são indexadas sob uma variedade de palavras chave,
algumas mais amplas do que outras, mais específicas o possível. Se você está
pesquisando por gatos, não utilize gatos como palavra chave a não ser que você não se
importe em receber resultados que incluem ?escaneamento de gatos? ? [algumas
pessoas escaneam seus gatos, literalmente, e expõem as fotos na internet]. Utilize
palavras que são mais unicamente relacionadas aos gatos, como felino ou bichano.
Especifique sua busca ao máximo, utilizando o menor número de palavras possível.
Uma busca por dente felino, que lhe traz mais de 3000 resultados no Google, não traz
nenhum resultado no Google Image Search; nesse caso, dente de gato funciona melhor.
(Construir frases para pesquisa de imagens exige muita paciência e experimentação).
Resultados de busca incluem um thumbnail [imagem em pequena escala], nome,
tamanho (tanto pixels e kilobytes), e a URL onde a imagem se encontra. Clicando sobre
a imagem apresenta uma página enquadrada, o thumbnail do Google para a imagem no
topo, e a página onde a imagem originalmente apareceu na parte de baixo.
Pesquisar no Google Images pode ser frustrante, porque é difícil construir buscas com
múltiplas palavras, e pesquisas com palavras únicas levam a milhares de resultados.
Você tem mais opções para otimizar a pesquisa tanto através da interface do Advanced
Image Search como das sintaxes especiais do Google Image Search.
Sintaxes especiais do Google Images
Google Images oferece algumas sintaxes especiais:
intitle:
Encontre palavras chave no título da página. Esse é um excelente meio para otimizar os
resultados de buscas.
Exemplo:
Eg: intitle: Grande Muralha da China
filetype:
Encontre imagens de um tipo particular. Isso funciona apenas para JPEG e GIF, não
BMP, PNG, ou qualquer outro formato que o Google não indexa. Note que para
pesquisa por filetype:jpg e filetype:jpeg não trará diferentes resultados, porque a
filtragem é baseada nas extensões de arquivo, e não um tipo de entendimento profundo
daquele tipo de arquivo.
Exemplo:
Eg: filetype:jpeg Albert Einstein
site:
Como na busca no Google regular, restringe seus resultados para um específico site ou
domínio. Não utilize para restringir resultados para um único domínio a não ser que
você tenha certeza do que exista lá. Ao invés, utilize para restringir resultados a certos
domínios. Por exemplo, pequise por futebol.site:br e depois pesquise por
futebol.site:com é um bom exemplo de como o uso do site: pode fazer diferença.
Google News
Pesquisa no Google permite que você busque por notícias de várias fontes na internet. O
campo de busca funciona como a busca no Google regular ? todas as buscas são
padronizadas AND. Os resultados são apresentados em clusters [emaranhados],
fornecendo título, fonte, data e um breve sumário (o link para a notícia completa está
incluído no título). O pesquisador pode selecionar suas buscas por relevância ou data.
Sintaxes especiais
Pesquisa no Google News suporta duas sintaxes especiais.
intitle:
Encontra palavras no cabeçalho de uma notícia.
Exemplo:
Eg: intitle:furacão
site:
Encontra artigos de uma fonte particular. (Google News possui mais de 4,000 fontes).
Exemplo:
Eg: furacão site:reuters.com
Tirando proveito do Google News
A melhor coisa sobre o Google News é sua capacidade de cluster. Em uma máquina de
busca comum, uma notícia impactante pode afogar os resultados de busca. Por exemplo,
em julho de 2002, circulou uma história de que terapia de substituição de hormônios
pode aumentar o risco de câncer. Rapidamente a utilização de máquinas de busca de
notícias para encontrar a frase ?câncer de mama? se tornou um exercício de futilidade,
porque dúzias de notícias sobre o mesmo tópico estavam agrupadas nas páginas de
resultados. Isso não acontece quando você pesquisa a máquina de busca de notícias do
Google, porque o Google agrupa notícias similares por tópico. Você poderia encontrar
um largo cluster de notícias sobre terapia de substituição de hormônios, mas eles
estariam em um único lugar, deixando você pesquisar outras notcias sobre câncer de
mama. Algumas buscas agrupam com facilidade; elas são especializadas e tendem a
gerar tópicos limitados. Mas outras buscas ? como ?George Bush? ? geram muitos
resultados e vários agrupamentos diferentes. Se você precisa pesquisar por um nome
famoso ou um tópico geral (como crime, por exemplo) otimize seus resultados de busca
através dos seguintes modos:
Adicione um tópico modificador que irá significantemente otimizar seus resultados de
busca, como em: ?George Bush? palestra na ONU. Limite sua busca com uma das
sintaxes especiais, por exemplo: intitle:"George Bush". Limite sua busca a um site
particular. Esteja ciente que, enquanto isso funciona bem para uma notícia de grande
impacto, você pode perder notícias locais. Se você está pesquisando por uma grande
notícia nos Estados Unidos, CNN é uma boa escolha (site:cnn.com). Se a noticia que
você está pesquisando é mais internacional, BBC funciona bem (site:bbc.co.uk).
Conclusão:
Como você viu, o Google é mais do que uma máquina de busca com base textual e
devotando um pouco de tempo na especificação do termo de busca, você pode
especificar sua pesquisa e acessar a informação desejada dentro de um universo de 2
bilhões de páginas no menor tempo possível. Estas pequenas técnicas que você
aprendeu agora certamente vão auxiliar no acesso integral ao poder do Google e
fazendo isso, toda a Internet vai se tornar seu playgroung. Boas Googladas.
Texto original disponível em: Googlemyway
Resumo dos operadores
avançados.
Operador: site:
Resultado da Busca: Todas as páginas de um domínio e todos os subdomínios se você
não usar o www.
Aplicações no SEO: Ver quantas páginas foram indexadas.
Operador: cache:
Resultado da Busca: A Versão em cache de uma página.
Aplicações no SEO: Ver uma cópia da ultima versão indexada de uma página.
Operador: info: ou id
Resultado da Busca: Mostra as informações que o Google possui sobre a URL
determinada.
Aplicações no SEO: Usada para ver algumas informações que o Google tem sobre essa
página.
Operador: related:
Resultado da Busca: Páginas que são similares a página especificada.
Aplicações no SEO: Usado para ver um pequeno indicativo do que o Google considera
ser conteúdo relacionado.
Operador: define:
Resultado da Busca: Páginas que possuem uma definição da keyword pesquisada.
Aplicações no SEO: Usado basicamente como um dicionário da web. Pode ser usado
para definição das suas keywords.
Operador: link:
Resultado da Busca: Páginas que linkam para uma URL específica. (No Yahoo, deve-
se usar http://.)
Aplicações no SEO: Usado para ver o número(não mostra todos os links nem uma
porcentagem fixa, é aleatório) e a qualidade dos inbound links para o site do seu cliente
e dos seus competidores.
Operador: filetype: ou ext:
Resultado da Busca: Páginas de um determinado tipo de arquivo que contenha sua
keyword.
Aplicações no SEO: Usado para analizar o uso de PDF’s, Flash, Documentos do Word
e Exel em determinado domínio.
Operador: allintitle
Resultado da Busca: Páginas que contenham todas suas keywords no seu título.
Aplicações no SEO: Usado para analisar os títulos de uma página.
Operador: intitle:
Resultado da Busca: Páginas que contenham sua keyword no seus títulos.
Aplicações no SEO: Usado para analisar os títulos de uma página.
Operador: allinurl:
Resultado da Busca: Páginas que contenham todas as suas keywords na URL.
Aplicações no SEO: Usado para analisar os títulos de uma página.
Operador: inurl:
Resultado da Busca: Páginas que contenham sua keyword na URL.
Aplicações no SEO: Usado para analisar os títulos de uma página.
Operador: allinanchor
Resultado da Busca: Páginas que contenham inbound links com sua keyword.
Aplicações no SEO: Usado para analisar o texto âncora dos inbound links.
Operador: intext:
Resultado da Busca: Páginas que tenham textos que contenham suas keywords.
Aplicações no SEO: Usado para analisar os textos de uma página.
Operador: allintext:
Resultado da Busca: Páginas que tenham textos que contenham suas keywords.
Aplicações no SEO: Usado para analisar os textos de uma página.
Operador: inanchor:
Resultado da Busca: Páginas que contenham inbound links com sua keyword.
Aplicações no SEO: Usado para analisar o texto âncora dos inbound links.