viernes, 26 de julio de 2013

Cerrado por vacaciones



Por fin ha llegado el momento, me voy de vacaciones¡¡
Ha sido un año duro entre el trabajo, la universidad, las webs que aun no logro que terminen de arrancar, el blog y... por supuesto mi vida personal.
Pero creo que le balance es muy positivo, en estas fechas es cuando suelo sacar un folio y hacer un resumen de cuáles son mis próximos objetivos, o lo que me gustaría, aquí os dejo algunos:
- Continuar con el blog con mayor asiduidad: Sí, no me olvido del blog, me encanta y después de unos años sin escribir en ninguno cada día el vicio es más grande, a ver si le voy buscando su tiempecito fijo cada día.
- Acabar le proyecto final de la uni: Lo único que me falta.
- Viajar: Soy de es@s a los que les gustaría largarse al extranjero a trabajar, no me quejo de mi empleo, me tratan de maravilla y me gusta, pero si no sales ahora... luego te haces cómodo. Es el momento de intentarlo ¿alguien me ofrece algún trabajo fuera o buenos consejos de cómo encontrarlo? ;)
- Mis webs: Algún proyecto ya abierto, pero casi abandonado por falta de tiempo, y otros proyectos que tengo en mente. Espero poder seguir programando con mayor tranquilidad.
- Y, cómo no, en cuanto al ocio cibernético: Subir mi pícara en el WoW, aquellos que jugáis ya  sabéis lo que es el PvP y un pícaro. Una historia de amor eterna :D
Para lo que os importa a vosotros... Espero poder volver en septiembre, a mediados, con buenos artículos, mas cortitos. Y sobre los que ya están subidos os los iré poniendo en pdf para que los disfrutéis en vuestra casa sin tener que volveros locos por el blog.
Me dejo de royos, me voy a la playa.
La primera será a vuestra salud :)

miércoles, 24 de julio de 2013

Bibliografia Haddop y MongoDB



Para la realización del trabajo se han consultado las siguientes fuentes de información.

·         http://es1.php.net/curl

Instalación de Hadoop



La instalación de Hadoop es un poco más tediosa. Hadoop tiene distribución para Windows pero es más recomendable instalarlo en Linux, entre otras cosas, porque funciona de forma más rápida, fiable y su instalación es más limpia.
Para proceder a la instalación descargaremos el software de la web oficial de Hadoop http://hadoop.apache.org/
 


Una vez hemos descargado el fichero “hadoop-1.1.1-bin.tar.gz” crearemos una carpeta “Hadoop” dentro del directorio “c:\cygwin\usr\local”.




En este directorio descomprimimos el contenido del fichero “hadoop-1.1.1-bin.tar.gz”, una vez descomprimido, dentro del directorio “conf” podemos observar que tenemos el fichero “hadoop-env.sh”. Este archivo es el que contiene la configuración de Hadoop, en este caso vamos a modificar los parámetros para usar un nodo único y se podrían personalizar muchas otras opciones (que investigaremos en un futuro).
Lo primero que hay que configurar en el fichero es la ruta de acceso a Java (que hemos instalado al principio del trabajo), para ello modificaremos el valor de la Variable “JAVA_HOME” con nuestro directorio “c:\\java\\jre” y además quitamos la almohadilla “#” de comentario de inicio de la línea para activar el parámetro.
Nota: Dado que “\” es un carácter especial por eso agregamos una “\” más en cada nivel para que la ruta sea reconocida correctamente.


Guardamos los cambios y probamos que realmente funciona Hadoop, para ello seguimos los siguientes pasos:
·         Paso 1: Abriremos una Shell de cygwin
·         Paso 2: En esta Shell navegamos por el directorio hasta llegar a “/usr/local/hadoop” (que es el directorio de instalación de Hadoop)
·        
Paso 3: Ejecutamos la orden “bin/hadoop version”.


Comprobamos que el mensaje que nos devuelve es la información de la versión de Hadoop (Hadoop 1.1.1), lo que nos permite asegurar que Hadoop está activo.

Una vez llegado a este punto el sistema está preparado con ambas herramientas instaladas (MongoDb y Hadoop) de una manera básica, a partir de aquí ya se puede evolucionar en la mejora de configuración y ampliación de ambas herramientas, se podrían aprovechar las capacidades de Hadoop para trabajar en clusters replicados.
Para ello podemos apoyarnos en toda la documentación y guías disponibles en la web algunas de la cuales reflejamos en la bibliografía adjunta.

Instalando Cygwin



Como en el caso de Java la instalación no es objeto del trabajo solo daremos las indicaciones esenciales para guiarse.
Cygwin es un software que emula en Windows la consola de Linux. Podemos descargarlo de su página oficial http://www.cygwin.com/





La instalación es sencilla siguiendo las instrucciones



Durante el proceso de instalación (si es la primera vez que instalamos el software) nos puede salir este mensaje de aviso, en ese caso pulsaremos “aceptar” para continuar.
Una vez instalado cygwin se nos abre una ventana donde podemos ver un registro por líneas que corresponden a programas.
Para nuestro trabajo necesitamos instalar ssh y para ello seguiremos los siguientes pasos:
·         Paso 1: En el cuadro “Search” teclearemos “ssh” y en la ventana nos aparecerá un árbol donde expandiremos la rama “Net”.

·         Paso 2: Buscamos la librería openssh
·        
Paso 3: Hacemos click sobre el símbolo “ “ varias veces y nos va mostrando las versiones que puede instalar, buscamos hasta que aparece la versión 6.1p1-1.


·         Paso 4: Pulsamos en siguiente para continuar la instalación y nos saldrá la siguientes ventana.



·         Paso 5: Pulsamos en siguiente para finalizar la instalación.


Una vez instalado el “ssh” hay que preparar el sistema para que pueda trabajar, para ello prepararemos el sistema para ello seguiremos los siguientes pasos:

·         Paso 1: Abriremos una Shell de cygwin
·         Paso 2: En esta Shell ejecutamos las siguientes instrucciones:
o   chmod +r /etc/passwd
o   chmod u+w /etc/passwd
o   chmod +r /etc/group
o   chmod u+w /etc/group
o   chmod 755 /var
o   touch /var/log/sshd.log
o  
chmod 664 /var/log/sshd.log


Con esto conseguimos:
·         Crear el fichero de log en la ruta necesaria para que lo pueda usar Hadoop.
·         Que cygwin pueda crear un usuario con los permisos necesarios para Hadoop y que no tengamos problemas cuando lo instalemos.


Ahora necesitamos configurar el “ssh”, para ello ejecutamos la orden “ssh-host-config”.
Nota: hay que esperar un poco para que se muestre configurador, no es necesario volver a ejecutarlo.


El configurador nos hará varias preguntas a las que contestaremos de la siguiente forma:
·         Query: Should privilege separation be used? à NO
·         Query: Do you want to install sshd as a service? àYES
·         Query: Enter the value of CYGWIN for the daemon: CYGWIN (el nombre es solo una etiqueta para reconocer el servicio lanzado en windows)


Nota: En caso que ya hayamos ejecutado el configurador anteriormente nos hará dos preguntas que contestaremos en base a lo que deseemos. En nuestro caso serían estas las respuestas.
·         Query: Overwrite existing /etc/ssh_config file? (yes/no) à no
·         Query: Overwrite existing /etc/sshd_config file? (yes/no) à no
 
El configurador nos sigue haciendo preguntas para la configuración:
·         Query: Do you want to use a different name? à YES
·         Query: Enter the new user name: à ssh
·         Query: Reenter à ssh
·         Query: Create new privileged user account ‘ssh’ à YES
·         Query: Please enter the password (en nuestro caso hemos puesto 12345)
·         Query: Reenter:



Para finalizar hay que levantar el servicio, para ello abrimos seguimos los siguientes pasos:
·         Abrimos el Menú de inicio de Windows, hacemos “click” con el botón derecho encima de “mi PC” o “equipo”.
·         En el submenú que aparece seleccionaremos “Administrar”

·         En la nueva ventana seleccionaremos “Servicios” y en la parte derecha buscaremos el servicio “CYGWIN sshd”.


·         Ahora tenemos que iniciar el servicio para ello pulsaremos con el botón derecho encima del servicio y en el nuevo menú seleccionaremos “iniciar”

Con esto ya tenemos el servicio funcionando y para comprobarlo en una consola de CYGWIN ejecutaremos el comando “ssh localhost”.



El ssh ha respondido por lo tanto esta activo. Ahora ya podemos proceder a la instalación de Hadoop