entropía

El desorden y el caos como forma de entender mi entorno ... by Horaci Cuevas

Betatesting Amazon EC2: Elastic compute cloud

Ec2

(See english post here)

Ayer nos llegó una beta para EC2, el nuevo servicio de Amazon para servidores virtuales integrado en su servicio de S3.

Cuando oí por primera vez de que iba, rápidamente pensé en esos lentos y poco productivos servidores virtuales, que no haces otra cosa que batallar por los recursos entre los demás usuarios de la maquina virtual. Pero, ya que habíamos sido de los pocos elegidos, decidí hecharle un vistazo, a fin de cuentas el servicio de S3 es impecable, y si Amazon decide sacar un servicio así es por que está orgulloso de él.

¿Cómo funciona?

Básicamente han unido algo parecido a UML con un repositorio de imágenes guardadas en S3. Mediante un conjunto de herramientas puede ordenar el inicio de una máquina virtual con una de las imágenes que tengas en tu repositorio, y en poco menos de un minuto tu máquina se ha “instanciado”, tiene una IP pública y puedes acceder a ella mediante SSH. Por cada hora (o fracción) que tengas una instancia encendida, has de pagar 0.10$, lo cual hace que cada servidor nos cuesta entre 70 y 75 dólares dependiendo del mes.

¿Que tipo de imágenes se pueden cargar?

Pues en principio cualquier imagen que sea compatible con el núcleo de Linux 2.6, aunque ellos sólo soportan Redhat Fedora 3 y 4. Como ya me acostumbré a Debian y cualquier otra cosa me cansa rápidamente, me puse manos a la obra para hacer una imagen de Debian usando debootstrap … Lo cierto es que fue un rotundo fracaso además de una pérdida de tiempo enorme: generar la imagen, instalar todo lo que quería instalar, comprimirlo, y enviarlo. Y acabé haciendo una copia de las imágenes públicas existentes de prueba.

¿Es permanente la información que guardemos en el servidor?

Pues la respuesta es tristemente: No. Si la instancia se termina, todo lo que haya en el servidor se perderá y solo se recuperará la imagen inicial con la que arrancó el servidor. Toda nuestra base de datos, logs y configuraciones se perderán. Es por eso que tenemos a nuestra disposición herramientas de backup muy muy útiles, que, sacando partida a la velocidad y agilidad de S3, se convierte en una tarea muy simple.

Es por este motivo que es casi OBLIGADO hacer un sistema de archivos distribuido entre varias instancias. De lo contrario, te arriesgas a la peor de tus pesadillas, lo cual, sube los costes considerablemente.

¿Es más rápido que un servidor virtual?

Aunque la respuesta es claramente sí, todavía se nota mucho más ágil un servidor normal (especialmente en tareas pesadas como compilar o mover grandes cantidades de datos).

Aquí teneis algunos benchmarks muy simples que he hecho:

Compile_time

Aunque la diferencia es una nada despreciable 1/3 parte más lento que nuestros servidores dedicados, es más que suficiente para un servidor especializado (web, base de datos, servidor de aplicaciones,…).

Sorprendentemente, vemos a nuestro buen AMD/FreeBSD rompiendo los esquemas nuevamente. Aunque, al ser otra plataforma, no es lícito comparar los resultados.

¿Es robusto para poner nuestras aplicaciones más críticas?

Aquí es donde claramente brilla sobre los servidores habituales. Se adapta al 100% a nuestras necesidades. Implementa firewalls i herramientas de administración en grupos que parecen sacadas de un libro de magia. (Por ejemplo, uno de los parámetros cuando creamos una instancia es, ¡el número de éstas! Por lo que podemos arrancar directamente un cluster de 20 servidores web y otros 10 de bases de datos en pocos minutos, que se escala a tus necesidades).

Algunas curiosidades…

Parece ser que las CPUs son Amd Opterons, como no podía ser de otra forma (AMD Opteron(tm) Processor 250). La plataforma consta de 1.75GB de memoria ram y 160GB de disco duro *volátil*.

Las herramientas internas para la creación de las imágenes y la publicación de estas en el servidor de S3 están hechas en Ruby.

No es posible asignar una IP estática a un servidor. Siempre se obtiene por DHCP. En función de algunas instancias, es posible que un servidor use la IP de otra instancia que hayas terminado recientemente.

El ping con Google es de 2ms =)´´´

La prueba

Para ver qué tal se comporta el servidor virtual, hemos hecho una réplica de Pricenoia dentro de los servidores virtuales de Amazon en esta dirección:

http://domU-12-31-33-00-02-6A.usma1.compute.amazonaws.com/

Claramente parece responder un poco peor que nuestro ya viejo Freebsd, aunque demuestra un rendimiento excepcional en las operaciones de cálculo y procesado de textos.

Lamentablemente parece que todavía están realizando pruebas, y tiene micro-cortes que son bastante molestos. Se puede notar en el web, pero se nota especialmente al acceder vía SSH (he llegado a ver como se quedaba congelada la sesión SSH durante más de 30 segundos) aunque por lo general tiene una respuesta estupenda.

Posted by Horaci on 08/25/2006 | Permalink | Comments (5) | TrackBack (0)

Spam - ¿dónde se origina?

Hace ya casi dos años pensé en un proyecto que creía que podría ser interesante. El trabajo y otros proyectos no me permitieron hacerlo realidad, pero ahora vuelvo a pensar en él.

Que pasaría si la fuente del spam no es quien hace Spam, que quizás sólo ha comprado una base de datos a una empresa que revende e-mails. El verdadero originador del spam sería quien ha vendido tu dirección E-Mail a esa empresa que revende e-mails.

¿Cómo saber quien vende tus e-mails cuando pones tu dirección E-Mail en un site?

Ahí está el proyecto: Trazar QUIEN ha vendido tu e-mail. Además, poder verificar una página para saber que tipo de e-mails, notificaciones y spam te puede enviar.

Por ejemplo, supongamos que me registro en www.sitiodudoso.com. Y me dicen algo que para acceder a la zona restringida tengo que registrarme ... e introducir mi dirección e-mail donde tendré que verificarlo para continuar el registro. Te registras, recibes un e-mail de validación de e-mail ... hasta aquí todo bien. Al cabo de un mes recibes un famoso e-mail de viagra alternativa y te preguntas ... ¿Cómo ha obtenido mi dirección de correo?

El proyecto trataría de validar los "spam sites", se asigna un identificador único dentro de una dirección e-mail y se registra en el site (de forma manual) introduciendo ese E-Mail, y luego esperar a "recibir" mensajes a esa dirección. Los editores del site entonces irían verificando los mails recibidos y asignando el grado de spam: Mail introductorio, Mail promoción interna, mail promoción otros productos, mail promoción terceras empresas del grupo, mail no procedente del site ni del grupo (spam 100%)

El proyecto se debería realizar de forma abierta y colaborativa (una persona no puede validar todos los e-mails! por lo que sería un proyecto abierto y de trabajo colaborativo).

Aquí hay un diagrama inicial del proceso del proyecto:

diagrama1.png

Aunque dada la magnitud, este se ha de realizar abiertamente, con colaboradores de todo el mundo más o menos activos, así que necesito saber la opinión de la gente antes de empezar nada =)

Posted by Horaci on 04/21/2004 | Permalink | Comments (6) | TrackBack (6)

Amazon - ¿Nos están timando en Europa?

Siguiendo el post de furilo y posteriormente el de pjorge me picó la curiosidad al respecto. Además, Albert comentó que estaría bien un web que te mostrase estas diferencias entre los sites de amazon.com y el resto de europa.

Hoy por la noche, hablando con Albert me he decidido a programarlo :) El resultado ha sido muy bueno y ya está funcionando. Mañana o pasado lo pondremos online en algún dominio =)

Por lo que he visto mientras iba haciendo el site, en algunos casos sale más barato en Alemania, otras en Japón y, la mayoría, más barato en USA.

Aquí os dejo un par de capturas de lo que tenemos hasta ahora :)

Actualización: Gracias a un comentario de Asier, también busca DVDs y CDs de música =)

 

Posted by Horaci on 02/06/2004 | Permalink | Comments (10) | TrackBack (4)

Seguridad en sistemas de alta disponibilidad

Mucha gente piensa que un sistema de alta disponibilidad únicamente sirve para proporcionar escalabilidad, rendimiento, tolerancia a fallos, etc. Pero las posibilidades van más allá. Especialmente en cuanto a materia de seguridad se refiere.

La alteración de los datos en un servidor, ya sea en un servidor web sencillo o ya sea dentro de un sistema de alta disponibilidad complejo, puede pasar totalmente desapercibido por la mayoría de administradores y solo percibir este cambio cuando ya se ha realizado el daño.

Alteración de datos en bases de datos, alteración de páginas web, instalación de troyanos, ejecución remota ... son las pesadillas de los administradores de red, y sus directores de negocio.

Mediante los sistemas de alta disponibilidad es posible realizar operaciones paralelas con los mismos orígenes de datos. Cumpliendo estas características una alteración local sería percibida por el resto de ordenadores que forman el cluster y permitiría detectar una posible intrusión, alteración o corrupción de datos.

Si las peticiones se ejecutan en paralelo, es posible evaluar los resultados igualmente en paralelo y así determinar cuando un servidor ha realizado una operación distinta a la operación que otros semejantes habrían realizado, detectando así una posible intrusión, fallo de servicio u otras causas.

Con el tiempo, estoy seguro que los sistemas avanzarán a un estado de desconfianza inicial donde sólo la democracia entre los servidores permitiría la detección de las vulnerabilidades anteriormente mencionadas.

Aunque series Manga como Neon Genesis Evangelion fue creado hace casi 10 años, la respuesta correcta deberemos dejarla siempre en manos Baltasar, Melchor y Gaspar.


Posted by Horaci on 12/12/2003 | Permalink | Comments (0) | TrackBack (2)

Lanzamiento de eConozco.com

Hoy 9 de Diciembre lanzamos nuestro último proyecto: eConozco.com.

Lo cierto es que estoy bastante emocionado con las posibilidades que ofrecen las redes sociales. La posibilidad de contactar con gente mediante las personas con las que tengo confianza sin tener que hacer mil llamadas de teléfono realmente cambiará mi manera de ver y hacer las cosas en el futuro.

Aquí os pongo la primera noticia que hemos publicado:

Se presenta eConozco.com, proyecto de redes sociales y networking online para profesionales

Después de varios meses de intenso desarrollo, sale a la luz eConozco, un innovador proyecto en internet dirigido a profesionales, que permite desarrollar las redes de contactos personales.

Internet ha modificado nuestra manera de trabajar y relacionarnos a nivel profesional. Gestionar el email, utilizar las intranets corporativas o realizar reuniones a distancia son algunas de las tareas a las que dedicamos cada vez más tiempo. Empezamos a estar preparados para gestionar algo tan intangible como nuestra red de contactos a través de internet : Aportando una nueva dimensión a nuestros contactos y agilizando la utilización de nuestra red de contactos actual.

A través del networking online, eConozco permite conocer nuestra red social y saber a que personas podemos acceder mediante nuestros contactos. Todo ello está sustentado por las relaciones de confianza existentes entre los miembros de nuestra red.

eConozco sale a la luz en versión Beta, en la última fase de su desarrollo, pese a que el sistema es totalmente estable y robusto. Esta decisión se ha tomado para poner a punto la aplicación teniendo en cuenta las experiencias de los usuarios en un entorno real, y poder recoger sus recomendaciones y consejos. En las próximas semanas se añadirán opciones y servicios, que conformarán la versión final.

eConozco es el primer site que utiliza el "social networking" y las teorías de redes sociales en España. Es un proyecto creado por un inquieto grupo de profesionales que provienen de distintas áreas y desarrollado por Grupo Galenicom TI, empresa de servicios de internet especializada en software de redes sociales.

Barcelona, 8 de diciembre de 2003

eConozco es uno de los primeros (si es que no es el primero) que realmente utiliza el "social networking" o redes sociales en España. No tiene nada que ver con los directorios públicos, páginas blancas o sites de reencuentro de compañeros del colegio. El site se fundamenta en la cadena de confianza que existen entre tus conocidos y los conocidos de estos ... y los conocidos de estos ... etc. permitiendo crear una red de contactos a partir de tus conocidos.

Posted by Horaci on 12/09/2003 | Permalink | Comments (2) | TrackBack (2)

Primer post y redes sociales

Hola!

Después de estar bastante tiempo mirando blogs de amigos y conocidos, he decidido crear mi propio blog e intentar aportar mi "grano" de opinión a los temas que me inquietan.

Desde hace un poco más de medio año mi principal inquietud han sido las ya conocidas redes sociales. El fenómeno de las redes sociales definirá, desde mi punto de vista, la confianza que se ha perdido en internet desde hace ya bastantes años. La red hace tiempo que dejó de ser anónima o libre, la confianza que tenemos de alguien que nos vende un teléfono móbil en eBay es mínima (por muchas estrellas o barras que otros usuarios anónimos le otorguen). Mi anonimidad y libertad empieza por no publicar mis datos personales a cualquiera o por no decirle a donde voy y a donde dejo de ir.

Las redes sociales solucionarán sin duda el marco en el que mis datos y mis relaciones tienen lugar en internet y fuera de ella.

Posted by Horaci on 12/07/2003 | Permalink | Comments (0) | TrackBack (0)

Recent Posts

  • Galenicom.com v3.0
  • Xing adquiere eConozco
  • Betatesting Amazon EC2: Elastic compute cloud
  • Yo apoyo a Dinamarca
  • Wt: A C++ Web Toolkit
  • eConozco 2.0
  • Physics Processor Unit
  • Pricenoia goes mobile!
  • Microsoft usa software pirata
  • Pricenoia - Engine mejorado

Mis sites

  • Pricenoia
  • Galenicom

Archives

  • May 2007
  • March 2007
  • August 2006
  • February 2006
  • January 2006
  • May 2005
  • March 2005
  • January 2005
  • December 2004
  • November 2004

About

Subscribe to this blog's feed