x
1

Buscador de Google



El buscador de Google o buscador web de Google (en inglés Google Search) es un motor de búsqueda en la web propiedad de Alphabet Inc. Es el motor de búsqueda más utilizado en la Web[2]​ y recibe cientos de millones de consultas cada día a través de sus diferentes servicios.[3]​ El objetivo principal del buscador de Google es buscar texto en las páginas web, en lugar de otro tipo de datos. Fue desarrollado originalmente por Larry Page y Sergey Brin en 1997.[4]

El buscador de Google proporciona al menos 22 características especiales más allá de la palabra original, entre ellas sinónimos, previsiones meteorológicas, zonas horarias, cotizaciones de bolsa, mapas, datos sobre terremotos, cartelera de cine, información de aeropuertos, listas de inicio y resultados deportivos. Hay funciones especiales para los números, incluyendo intervalos (70.. 73), precios, temperaturas, conversiones de unidades y de monedas ("10,5 cm en pulgadas"), cálculos ("3 * 4 + sqrt (6)-pi / 2"), seguimiento de paquetes, patentes, códigos de área telefónico, y traducción de páginas mostradas.

El orden de los resultados de búsqueda (ghits, por Google hits) en las páginas de resultados de Google se basa, en parte, en un rango de prioridad llamado "PageRank". El Buscador de Google proporciona muchas opciones para la búsqueda personalizada, utilizando operaciones booleanas como exclusión ("-xx"), inclusión ("+ xx"), alternativas ("xx O yy") y comodín ( "x * x")[5]

La frecuencia de uso de los términos de búsqueda ha alcanzado un volumen que puede indicar más tendencias económicas, sociales y de salud.[6]​ Los datos sobre la frecuencia de uso de los términos de búsqueda en Google (disponible a través de Google Adwords, Google Trends y Google Insights for Search) demuestran que hay correlación entre los brotes de gripe y los niveles de desempleo y proporcionan la información más rápidamente que los métodos tradicionales de presentación de informes y encuestas del gobierno.[7][8]

El 12 de mayo de 2009, Google anunció que analizaría los micro formatos de hCard, hReview y hProduct para incrementar las páginas de resultados de búsqueda con lo que llamaron "Rich snippets".[9]

En junio de 2011, Google introdujo "Google Voice Search" y "Google Images", características que permiten a los usuarios buscar palabras al hablar y por imágenes.[10]

A finales de junio de 2011, Google cambió el diseño de su página principal con el fin de impulsar el uso de herramientas sociales.[11]​ Los enlaces de publicidad, socios de negocios e información de empresas se llevó al borde inferior del navegador. Uno de los cambios principales fue reemplazar la barra de navegación clásica con una negra. El director creativo digital de Google Chris Wiggins explica: «Estamos trabajando en un proyecto para proporcionarle una experiencia de Google nueva y mejorada y en los próximos meses seguirán viendo más cambios de nuestra apariencia». [12]

El porcentaje exacto del total de las páginas web que Google encuentra no se conoce, ya que es muy difícil de calcular. Google no sólo busca los índices y las cachés de las páginas web, sino que también toma «imágenes» de otros tipos de archivos, incluyendo PDF, documentos de Word, hojas de cálculo Excel, Flash SWF, archivos de texto plano, etc.[13]​ Excepto en el caso del texto y de archivos SWF, la versión en caché es una conversión de (X)HTML, permitiendo que aquellos sin la aplicación de visualización correspondiente puedan leer el archivo.

Los usuarios pueden personalizar el motor de búsqueda mediante el establecimiento de un idioma por defecto, a través de la tecnología "SafeSearch", filtrando y definiendo el número de resultados que se muestran en cada página. Google ha sido criticado por colocar cookies a largo plazo en las máquinas de los usuarios para almacenar las preferencias de estos, una táctica que también les permite seguir los términos de búsqueda del usuario y retener los datos durante más de un año. Para cualquier consulta, pueden mostrarse hasta los 1000 primeros resultados con un máximo de 100 por página. La posibilidad de especificar el número de resultados está disponible sólo si "Búsqueda instantánea" no está habilitada. Si "Búsqueda instantánea" está activada, sólo se mostrarán 10 resultados, independientemente de cualquier otro ajuste.

Google Instant, una mejora que muestra los resultados sugeridos mientras el usuario escribe, se presentó el 8 de septiembre de 2010. Una de las preocupaciones es que la gente seleccione uno de los resultados sugeridos en vez de terminar su petición y que esa práctica podría causar parcialidad hacia empresas familiares u otros términos de búsqueda. Términos pornográficos y otros términos ofensivos están excluidos de los resultados sugeridos. La función instantánea aparece sólo en el sitio de Google original y las páginas no especializadas de iGoogle. Google espera que las búsquedas de Google Instant sean de 2 a 5 segundos más rápidas y dicen que en conjunto serían 11.000.000 segundos por hora.[14]​ Los expertos de marketing de motores de búsqueda especulan con que Google Instant tendrá un gran impacto en las localidades.[15]

Junto al lanzamiento de Google Instant, Google deshabilitó la posibilidad de que los usuarios elijan ver más de 10 resultados por página. La búsqueda instantánea puede desactivarse a través de las "preferencias" del menú, pero el estilo de compleción automática de sugerencias de búsqueda ya no se puede desactivar. Un representante de Google dijo: "Está en consonancia con nuestra visión de una experiencia de búsqueda unificada de Google hacer popular las características útiles del motor en lugar de mantener distintas versiones de Google. Como la calidad de "Autocompletar" ha mejorado, nos pareció que era apropiado para todos nuestros usuarios tenerlo siempre activo."[16]

Muchos usuarios han reportado haber sido incapaces de desactivar la búsqueda instantánea en sus preferencias de Google.[17]

La publicación de 2600: The Hacker Quarterly ha compilado una lista de palabras que están restringidas por Google Instant. Son los términos que la búsqueda instantánea no mostrará.[18][19]​ La mayoría de los términos son a menudo vulgares y despectivos en sí, pero también se eliminaron algunas búsquedas aparentemente irrelevantes como "Myleak".

Además de su herramienta para la búsqueda de páginas web, Google también ofrece servicios para la búsqueda de imágenes, grupos de noticias, noticias de sitios web, videos, localidades, mapas y artículos para la venta en línea. En 2013, Google indexó más de 60 trillones de páginas web[1]​ y registró 54.300 consultas por segundo, 400 millones de consultas por día, 1.300 millones de imágenes y más de mil millones de mensajes de Usenet. También coloca en caché gran parte del contenido que indexa. Google opera otras herramientas y servicios, como Google News, Google Suggest, Google Product Search, Google Maps, Google Co-op, Google Earth, Google Docs, Picasa, Panoramio, YouTube, Google Translate, Google Blog Search y Google Desktop Search.

También hay productos disponibles en Google que no están directamente relacionados con búsquedas. Gmail, por ejemplo, es una aplicación webmail, pero incluye funciones de búsqueda. Google Browser Sync no ofrece facilidades de búsqueda, aunque tiene como meta organizar su tiempo de navegación.

Google también posee muchos productos que están en beta, como por ejemplo Google Social Search o Google Image Swirl.

Además de la principal función de motores de búsqueda de texto, el Buscador de Google tiene más de 22 "características especiales" (que se activan al escribir cualquiera de las docenas de palabras de activación) en la búsqueda:[20]

En mayo de 2010 Google lanzó su sistema de cifrado SSL de búsqueda web.[22]​ La búsqueda cifrada puede accederse por encrypted.google.com[23]

El buscador de Google consiste de una serie de sitios web. El más grande de ellos, el sitio google.com, es la página web más visitada del mundo.[24]​ Algunas de sus características incluyen un enlace que proporciona la definición para la mayoría de las búsquedas incluyendo palabras del diccionario, el número de resultados que obtuvo en su búsqueda, enlaces a otras búsquedas (por ejemplo, palabras que Google cree que son incorrectas, le proporciona al usuario un enlace a los resultados de búsqueda utilizando la ortografía propuesta por Google), y muchas cosas más.

Google +1 ayuda a las personas a descubrir contenido relevante y cuya meta es incrementar los resultados de búsqueda de Google, ofreciendo un estado para mostrarles a las personas si la página es confiable o no. Cuando un usuario de Google utiliza los resultados de búsqueda de Google mostrará un botón +1 para recomendar la página y una anotación con los nombres de las conexiones de los usuarios que han recomendado su página.

A raíz de su importante posición de liderazgo en el mercado, Google es objetivo principal del así llamado spam contra buscadores. En este sentido se intenta posicionar la mayor cantidad posible de palabras de búsqueda entre los primeros resultados. Estas palabras claves muchas veces no tienen ninguna relación con el contenido real de las páginas. Se utilizan técnicas como Páginas-Doorway, Farm-Links o Page-Cloacking.

Esta posibilidad se comprobó por vez primera a la luz de la opinión pública en relación con una Bomba-Google, que estaba orientada al presidente de los Estados Unidos George W. Bush. La palabra de búsqueda "miserable failure" (en castellano: "fracaso miserable") fue enlazada por los adversarios de Bush a la página oficial con la biografía de Bush en la Casa Blanca.[25]

Como contrapartida intentaron los partidarios de Bush hacer lo mismo contra Michael Moore (director del documental Fahrenheit 9/11). Desde ese momento los primeros puestos varían frecuentemente entre ambos.

Las manipulaciones que tienen como objetivo mejorar el ranking de websites especialmente en Google, son consideradas desde ese momento Google-Spamming. Para evitar el abuso, Google cambia su algoritmo con frecuencia.

En ciertas ocasiones, el logotipo en la página web de Google va a cambiar a una versión especial, conocido como "Google Doodle". Al hacer clic en Doodle, llevará al usuario a una cadena de resultados de búsqueda de Google sobre el tema. El primero fue una referencia al Festival Burning Man en 1998[26][27]​ y otros han sido producidos para el cumpleaños de personas notables como Albert Einstein, los acontecimientos históricos como el 50 aniversario del bloque de Lego, días festivos como el Día de San Valentín o eventos del país donde se realice la búsqueda.[28]

Google afirma que cada consulta requiere de alrededor de 1 kJ o 0,0003 kW h. [29]

Puesto que Google es el buscador más popular, muchos webmasters desean influenciar la clasificación de su sitio web en Google. Una industria de consultores ha surgido para ayudar a los sitios web a aumentar su ranking en Google y en otros motores de búsqueda. Este campo, llamado optimización de motores de búsqueda (SEO en inglés), trata de discernir patrones en los listados de motores de búsqueda y luego desarrollar una metodología para mejorar la clasificación y atraer a más usuarios a los sitios de sus clientes.

La optimización de motores de búsqueda abarca tanto factores en la página (como el cuerpo del texto, los elementos del título, los elementos del título y la imagen de los valores del atributo alt) como factores de optimización fuera de la página (como texto de anclaje y el PageRank). La idea general es afectar el algoritmo de relevancia de Google mediante la incorporación de las palabras claves en la página, en particular el título y el cuerpo del texto (nota: mientras más arriba esté en la página, mayor son las posibilidades de la prominencia de palabras clave y por lo tanto, su clasificación). Sin embargo, demasiadas repeticiones de la palabra clave causan que la página para buscar luzca sospechosa para el algoritmo de control Google que evita spam.

Google ha publicado una guía para propietarios de sitios web que deseen mejorar su clasificación en el uso de consultores legítimos de optimización.[30]

Un sistema distribuido es un conjunto de computadoras separadas físicamente y conectadas entre sí por una red de comunicaciones distribuida. Google es uno de los sistemas distribuidos más complejos en uso. Su infraestructura ha satisfecho requisitos necesarios como: escalabilidad, rendimiento, fiabilidad y carácter abierto.

La tarea de un crawler es localizar y obtener los contenidos de la Web y pasar el contenido a subsistemas de indexado. Para ello se utiliza el software Googlebot que, recursivamente, lee una página web dada obteniendo los enlaces y planificando nuevas operaciones de rastreo. La frecuencia de las visitas depende de cuánto cambia la página.

Google Hummingbird: En septiembre de 2013 Google lanza Google Hummingbird o Google Colibrí,[31]​ nuevo algoritmo que viene a sustituir a Google Caffeine y cuyas principales novedades estriban en la posibilidad de responder a preguntas en lugar de interpretarse cada una de las palabras por separado.[32]​ Para Google ello supone un avance más hacia el buscador inteligente. Google Colibrí no incidiría de una manera directa en penalizaciones, sino que supondría un avance en el desarrollo independientemente de cómo otras modificaciones como Google Panda o Google Penguin sí han introducido elementos de lucha contra el spam.

Produce un índice de contenidos similar al de un libro. Técnicamente se denomina indexado inverso de palabras que aparecen en páginas web y otros recursos textuales como documentos en.pdf,.doc y otros formatos. No solo guarda la posición, también almacena otra información relevante como el tamaño de fuente y capitalización. Utilizando este índice, se reduce el número de páginas candidatas de miles de millones a unas decenas de miles, según el poder discriminativo de las palabras buscadas.

La indexación también mantiene un índice de enlaces, llevando un seguimiento de qué páginas apuntan a una página web.

El problema con el indexado es que no proporciona información sobre la importancia relativa de las páginas web que contienen un conjunto de palabras clave. Todos los motores de búsqueda modernos tienen una clasificación que indica la importancia de la página y asegura que las más importantes aparecen en los primeros puestos de la lista de resultados.

Google utiliza el algoritmo PageRank para decidir la importancia de la página web. Está basado en los sistemas de ranking de las publicaciones científicas, un artículo es importante si ha sido citado por otros colegas del área. El ranking en Google también tiene en cuenta factores relacionados con la proximidad de la búsqueda a las palabras clave de la página obtenidas en el indexado inverso.

Los anteriores métodos basados en palabras claves utilizados por muchos motores de búsqueda que fueron una vez más popular que Google, clasificaban las páginas por la frecuencia con que los términos de búsqueda ocurrían en la página o qué tan frecuentemente fueron asociados los términos de búsqueda en cada página de resultados.

Además de PageRank, Google ha añadido muchos otros criterios no mencionados para determinar la clasificación de las páginas de las listas de resultados, se reportó que hay más de 200 indicadores diferentes.[35][36]​ Los detalles específicos de los cuales se mantienen en secreto para permitirle a Google mantener una ventaja sobre sus competidores a nivel mundial.

La filosofía de Google en términos de infraestructura física es el uso de un gran número de PCs como base para producir un entorno para computación y almacenamiento distribuido. Típicamente un PC tendrá 2 TB de disco, 16 GB de DRAM y utiliza una versión reducida del kernel de Linux.

Estrategias contra fallo: al utilizar PCs de bajo coste, Google reconoce que partes de su infraestructura fallan, y por tanto se han diseñado unas estrategias para tolerar dichos fallos.

Arquitectura física: está compuesta por los siguientes componentes

Capacidad de almacenamiento: si cada PC ofrece 2 TB de almacenamiento, entonces un rack de 80 PCs ofrece 160 TB, con un cluster de 30 racks se ofrecen 4,8 petabytes. No se conoce exactamente el número de máquinas que tiene la compañía pero podemos asumir que cuentan con unos 200 clusters, que ofrecen 960 petabytes de almacenamiento, casi 1 exabyte (10^18 bytes).

El sistema está compuesto por un grupo de servicios distribuidos que ofrecen funcionalidad a los desarrolladores. Están divididos en las siguientes categorías:

Paradigmas de comunicación, que incluyen servicios para comunicaciones tanto remotas como multicast.

Datos y coordinación, proporciona almacenamiento y acceso coordinado a datos.

Computación distribuida, proporciona servicios para el uso de computación paralela y distribuida sobre la arquitectura física.

Algunas búsquedas dará el error "403 Forbidden error" con el texto

"Lo sentimos...... pero tu consulta se parece a las solicitudes automatizadas de un virus informático o aplicación de spyware. Para proteger a nuestros usuarios, no podemos procesar su solicitud por los momentos. Vamos a restaurar su acceso tan pronto como sea posible, inténtelo de nuevo en unos minutos. Mientras tanto, si usted sospecha que su computadora o red ha sido infectada, es posible que desee ejecutar un antivirus o eliminador de spyware para asegurarse de que sus sistemas estén libres de virus y otras aplicaciones malignas. Pedimos disculpas por las molestias, y esperamos su pronto regreso a nuestra plataforma de Google."

A veces, seguido de un sistema CAPTCHA.[38]

La pantalla fue reportada por primera vez en 2005 y fue una respuesta a la fuerte utilización de Google por empresas de optimización de búsquedas para verificar el rango de los sitios que optimiza. El mensaje es provocado por un gran volumen de solicitudes a partir de una única dirección IP. Google al parecer utiliza cookies como parte de su protocolo para determinar si rechaza el servicio o no.

En junio de 2009, después de la muerte de la superestrella del pop Michael Jackson, apareció este mensaje a muchos usuarios de internet que estaba buscando en Google las noticias relacionadas con el cantante y fue asumido por Google que fue un ataque DDoS, aunque muchas preguntas fueron presentadas por buscadores legítimos.

Google etiqueta resultados de búsqueda con el mensaje "Este sitio puede dañar tu equipo" si el sitio es conocido por instalar software malicioso. Google hace esto para proteger a los usuarios que visiten este tipo de sitios web. Por aproximadamente 40 minutos el 31 de enero de 2009, todos los resultados de búsquedas fueron clasificados erróneamente como malware y por lo tanto, no se podía hacer clic en él. En su lugar, aparecía un mensaje de aviso al usuario y era requerido que el usuario introdujera la dirección URL solicitada de forma manual. Este problema fue causado por un error humano.[39][40][41][42]​ La dirección URL de "/" (que se expande a todas las URLs) fue agregado por error en el fichero de patrones de malware.

Google está disponible en muchos idiomas y ha sido modificado por completo o en parte, para muchos países.[43]

La interfaz también ha sido puesta a disposición en varios idiomas con fines humorísticos:

Además de la URL Google.com principal, Google Inc. posee 160 nombres de dominio para cada uno de los países/regiones para las que se ha modificado.



Escribe un comentario o lo que quieras sobre Buscador de Google (directo, no tienes que registrarte)


Comentarios
(de más nuevos a más antiguos)


Aún no hay comentarios, ¡deja el primero!