Otro de mis pequeños proyectos

Etiqueta: facebook

PHP Conference 2010. Dí­a 2

Y como todo lo bueno siempre se acaba, la PHP Conference 2010 ha dado cerrojazo.

No sin polémica ya que el ganador de la XBOX del sorteo general se llevó también el iPad del sorteo de emagister… la suerte está mal repartida :p (hay que aclarar que el sorteo ha sido legal y a la vista de todos, hay poco que añadir a parte de que la mecánica pueda -posiblemente- cambiarse para el año que viene y unir ambos sorteos).

Y esta fue la elección para el segundo dí­a. Creo que bastante más acertada que el primer dí­a, aunque con alguna decepción:

  • Graphs in the database: RDBMS in the social networks age by Lorenzo Alberton
  • APC & Memcached: the high performance duo by Ilia Alshanetsky
  • Database version control without pain by Harrie Verveer
  • Continuous Improvement in PHP projects by Thorsten Rihnne
  • PHP Team organisation by Damien Seguy

Seguidamente, un resumen de cada una de ellas.

Graphs in the database: RDBMS in the social networks age by Lorenzo Alberton

De nuevo, tras haber ya asistido el año pasado a otra charla magistral, otra interesantí­sima chala de Lorenzo sobre grafos, árboles y bases de datos. Esta vez centrada en dos puntos, las CTE (Common Table Expressions) y Window Functions.

Pese a ser una charla compleja debido a que la presentación se basa en ejemplos SQL y en la teorí­a, Lorenzo realiza un esfuerzo inhumano para hacerlo entendible desde un primer momento. Además, este año mostró ejemplos reales y concretos que todos conocí­amos en la web y que nos destripó a nivel de base de datos.

Tras una breve introducción a los gráficos y sus componentes nos mostró diversas soluciones posibles a la hora de plantear una estructura de árbol en una base de datos a la que seguro que todos nos hemos enfrentado alguna vez. Tras unos consejos básicos de rendimiento y eficiencia y demostrar como realizar cualquier tipo de consulta que abarcara más de un nivel (por ejemplo coger los hijos hasta n niveles), mostró las CTE gracias a WITH (y WITH RECURSIVE). Como si de una función o proceso almacenado se tratase pero viviendo únicamente en el momento de la ejecución, con sus partes bien diferenciadas (inicialización, recursividad y llamada), nos mostró ejemplos desde la clásica sucesión de Fibonacci hasta cómo se pueden encontrar combinaciones de vuelo o transporte mediante varios saltos, los grados de separación en LinkedIn, cómo encontrar los contactos (de camino mí­nimo) entre tú y otra persona o los «quizás conozcas». Todos estos últimos ejemplos usando Transitive Closures.

También nos mostró como a veces técnicas como esta pueden ser un embrollo y un simple INTERSECT puede solucionar el problema de una forma muy sencilla y rápida.

El segundo caso, las Window Functions (SQL-2003) que nos permiten agrupar cierto número de filas que tienen una relación y extraer datos concretos (por ejemplo, una media de salarios por departamento) y usar ese dato para cada fila, pero sin agruparlas ya que perderí­amos cada usuario, es decir, sin usar un GROUP BY. La sintaxis es bastante liosa en un inicio y mucho más potente de lo que a primeras aparenta pero sin duda, gracias a ciertas funciones complementarias, con aplicaciones muy interesantes como poder extraer en una misma petición lo datos completos de venta un dí­a y también agrupados por usuario o los datos agrupados y paginados de los contactos telefónicos.

Por último nos llamó a la reflexión ante qué debe ser bueno ejecutar sobre base de datos y que no ya que se puede ver con los ejemplos como podemos quitar carga de procesado en la parte de aplicación, eliminando conexiones y RTT entre la base de datos y la aplicación, pero que ello conlleva sobrecargar la base de datos.

APC & Memcached: the high performance duo by Ilia Alshanetsky

La charla empezó la charla dando cuál iba a ser el slogan: «Slide motto: not everything has to be real-time». Y lo siguiente en darme cuenta fue que es realmente un crack y que su trepidante velocidad y conocimiento hace que perderte unos segundos escribiendo algo en el portátil puede hacer que te pierdas gran parte de un slide.

La estructura de la charla en mi opinión fue perfecta: breve introducción de las aplicaciones y cómo instalarlas (que estoy seguro que eran conocidas para la amplia mayorí­a de los asistentes) y tras esto, una serie de consejos, buenas prácticas y trucos de cada una de ellas. Eso sí­, yo creo que el oxí­geno se lo inyectaba, porque no creo que le diese tiempo a respirar entre frase y frase, jeje.

En cuanto a APC, lo primero a tener en cuenta es que tenemos el cacheo propio y transparente que hace de los opcodes, con la consecuente mejora de rendimiento que conlleva y que además podemos usar para cachear datos en shared memory. Y lo más importante, lo que se cachea no es el valor, sino el propio opcode. La ventaja de este método es radical ya que si comparamos con un método trandicional de cacheo mediante serialización de datos (aunque sea binario), siempre hay que realizar la propio acción de serialización y deserialización, desmaterializando y materializando los objetos, mientras que APC cachea el propio opcode, el dato en sí­, algo que es mucho más rápido y efectivo.

Otros trucos: cómo saber cuando apc_fetch nos ha devuelto información o no y es gracias a un segundo parámetro que tenemos que pasar por referencia ya que lo que se retorna es el dato y puede ser cualquiera de los valores posibles (null, true, false, array, objeto…) por lo tanto necesitamos un punto de referencia.

Y como consejo muy importante, evitar todo lo posible el borrado de caché: «Don t delete: deleting from cache is expensive as it may need to re-structure internal hash tables». A veces el mejor borrar todos los datos de un usuario que un dato concreto debido a todo el proceso que puede desencadenar.

Como contra, APC es un sistema de cache única y exclusivamente para PHP, nadie más puede usarlo y es local, no distribuí­do, lo que limita su radio de acción.

En cuanto a memcached, lo primero que nos hizo notar fue la necesidad de usar la extensión de Andrei Zmievski y no la otra existente que no lleva d al final ya que la diferencia y mejoras es notable: serialización binaria mediante igbinary, compresión fastlz, interface multiservidor y soporte ante fallos de caí­das.

Con esta extensión, tenemos (entre otras muchas cosas, a destacar):

  • getResultCode() para saber si hemos recuperado un ejemplo o no (comparándolo con MemCached::RES_SUCCESS)
  • podemos asignar y recuperar varios valores simultáneamente con [get|set]Multi()
  • se pueden añadir varios servidores son prioridad o balanceo usando addServers() y el tercer parámetro para cada servidor
  • podemos segmentar información indicando el servidor concreto donde se almacenará (sin dejar que memcached decida) gracias a [add|get|set|delete]ByKey()
  • segmentar varios datos a la vez [add|get|set|delete]MultiByKey()
  • utilizar contadores atómicos increment() y decrement()

Y por último, destacar el hecho de poder pedir datos de forma retardada (delayed fetch) de modo que nuestra aplicación no tenga que esperar, sino que puede hacerlo más tarde, continuando con la ejecución de nuestra aplicación. Lo que hay que tener muy en cuenta es que la información es probable que no venga en orden.

Database version control without pain by Harrie Verveer

Tengo que decir que esta charla me defraudó mucho. Con un tí­tulo tan potente ante un tema que realmente da muchos quebraderos de cabeza, no esperaba que diese el quid que solucionase completamente el problema (algo que parece que sí­ dice el tí­tulo o eso esperábamos todos los presentes), pero sí­ que parecí­a algo importante.

Pero más allá de la realidad, nos dio varias de las herramientas que actualmente existen y que intentan facilitar el trabajo y declarar que el problema es muy importante y hay que llevarlo con cautela. Sí­ que me quedo con una frase que me parece muy importante: «Never modify a patch file once it is version control». Es decir, en caso de que hagas un patch file y tenga un error, no debes corregir ese, sino crear «el patch del patch» que lo solucione.

Estas son las herramientas recomendadas:

En las preguntas finales: el propio ponente declaró que su estrategia es un «homebrew script» aunque otros equipos en su empresa usan DB deploy y parecen estar muy contentos.

Continuous Improvement in PHP projects by Thorsten Rihnne

En esta charla en primer lugar se mostró cómo un código que se mejora constantemente funciona mucho mejor, demostrando además como técnicas ágiles y la integración continua van de la mano. Tras mostrar estos conceptos muy relacionados principalmente con scrum, se mostraron una serie de herramientas desarrolladas en su empresa (o mejoradas) que ayudan a la hora de controlar un proyecto e intentar que mejore.

Las aplicaciones que se mostraron fueron:

PHP Team organisation by Damien Seguy

De manos del genial Damien Seguy asistimos a una charla sobre cómo realizar gestión de equipos, mejorar su implicación y como gestionar impedimentos. Fueron muchos los consejos, pero podemos resumirla en la siguiente lista que se explica por sí­ sola:

  • Weekly meeting
    • Discussion of future stuff
    • Specific training on tools, methods
    • Read indicators (audits, PI, ec)
    • Review reference documents
    • One question each (helps prepare for the meeting
  • Name domain gurus
    • Create domain experts
    • Specific domain
    • Unit test, IHM, database
    • Willing team member
    • Name it after he has taken the responsability
  • Healthy competition
    • Number of unit tests
    • Lines of codes
    • Number of methods
    • Number of commits
  • Learn to say no
  • 5 minutes meeting daily
  • Short cycles
  • References
  • PHP Mantra: short version of conventions
  • Evangelize
  • Name your teams/projects
  • Tag your code
  • Cross audits

PHP Conference 2010. Dí­a 1

Tras terminar el primer dí­a, voy a dar un pequeño repaso de las charlas en las que he estado. De entre todas las charlas disponibles, yo he elegido estas:

  • Doctrine 2.0 by Juozas Kaziukenas
  • Distributed Source Code Management by Hugh Gilmour
  • Varnish in action by Thijs Feryn
  • PHP in the Enterprise: Develop and Deploy Mission Critical Applications by Kuassi Mensah
  • Desarrollo de aplicaciones para Facebook en PHP by Victor Castell
  • Architecture and testability by Giorgio Sironi
  • Comet: by pushing server data, we push the web forward by Philip Ross

De primeras, con lo que he visto y he podido leer en twitter, tengo que decir que parece que he cogido las más «divulgativas» y yo he venido con bastantes ganas de ver cosas nuevas o por lo menos ver código y aplicaciones.

Ahora, un breve resumen de cada una de ellas.

Doctrine 2.0 by Juozas Kaziukenas

Un repaso por lo que va a ser Doctrine 2.0, tanto por las nuevas caracterí­sticas que tendrá como por comparación con Doctrine 1.x. La versión actual de Doctrine, pese a ser lento, tener un alto uso de memoria (principalmente por un uso cí­clico de referencias), su «magia» y otros problemas como la dificultad de ejecutar «raw» SQL, sigue siendo el mejor ORM para PHP hoy en dí­a y por ello Doctrine 2 tendrá esas funcionalidades (y más) aunque cambiará la forma de hacerlo.

Reescrito completamente para PHP 5,3, con una nueva API simplificada y muchas mejoras de rendimiento es la tarjeta de visita de esta nueva versión.

Además, se divide en 4 módulos: Common, DBAL (DB Abstraction Layer), ORM y ODM (Object Document Layer). Este último permitirá trabajar con motores NoSQL, otra de las nuevas caracterí­sticas.

Una interesante charla de introducción a lo que va a ser Doctrine 2.

Distributed Source Code Management by Hugh Gilmour

La charla tuvo dos partes diferenciadas, la primera fue una revisión del distinto software usado a lo largo del tiempo para realizar control de código y la segunda fue una comparación entre git, bazaar y mercurial.

Desde mi punto de vista, la parte más interesante fue la segunda, aunque fue algo particular ya que no se basaba únicamente en compararlos desde el punto de vista de cómo se realizan las revisiones, o las caracterí­sticas de los branches y merges, sino también dio las herramientas que se usan para todos ellos, soporte de IDEs e incluso bugtrackers e integración contí­nua. Muy interesante para analizar estas diferencias que en más de un caso, pueden ser muy importantes.

De todas formas, me quedo con perlas dichas por Hugh como «Simplest option is always the best» y «Work at the level of the least technical person in the project». La primera porque es una máxima que creo que hay que seguir siempre, sobre todo en el desarrollo de software como buen principio y la segunda porque a la hora de elegir cualquier opción, el factor humano y profesional debe tenerse en cuenta, que no quiere decir que haya que poner lo más simple (que no sencillo), sino lo que se adapte mejor, hay que buscar lo mejor.

Varnish in action by Thijs Feryn

Presentación que muestra las posibilidades de Varnish, aunque sin profundizar demasiado en el producto. Se muestran muchas de los comandos y configuraciones que nos permiten configurar la aplicación considerando que la principal aplicación de Varnish es la de caching.

Creo que aunque se intentaba mostrar toda la potencia del servicio, que realmente parece muy potente, a la vista de cómo es la configuración, principalmente mediante comandos y subrutinas en ficheros, realmente esconde un entorno bastante complicado de configurar.

Una charla muy rápida (casi 100 transparencias en 50 minutos) a nivel visual fue difí­cil de seguir debido al ritmo tan trepidante impuesto por Thijs que aclaró desde un primer momento que no tení­a perfil técnico, algo que se echó de menos en algunos momentos.

PHP in the Enterprise: Develop and Deploy Mission Critical Applications by Kuassi Mensah

Charla muy marcada por la presencia de Oracle (recordemos que el Platinum partner) en la que se mostraba algunas de las caracterí­sticas que provee Oracle como base de datos en los cambios entre entornos, facilitando distintas aplicaciones y el cambio.

Desarrollo de aplicaciones para Facebook en PHP by Victor Castell

Esta charla/taller estaba dividida en dos (algo que no estaba muy claro en el programa ya que tan sólo estaba en dos sesiones separadas por uno de los descansos largos) y sólo pude asistir a la primera parte.

La idea era buena puesto que se querí­a mostrar cómo realizar una aplicación en PHP para Facebook y de hecho, para avanzar en el proceso y hacerlo más sencillo, creo que la forma de realizarla no estuvo nada organizada, lo que provocó que en los 50 minutos que estuve en la charla, apenas se dieron los conceptos básicos, haciendo principal hincapié en las condiciones de uso de Facebook, los problemas que tiene el desarrollo en Facebook (latencias, caí­das, cambios en la API, etc) y en que hay que buscar la aplicación que se interesante para el cliente. Pero el tiempo empleado por ejemplo en dar de alta la aplicación en Facebook (pudieron ser tranquilamente 3o minutos) me pareció excesiva y poco fructí­fera ya que, exceptuando un par de conceptos que sí­ que es necesario explicar y aclarar, el resto se podí­a suponer de una forma bastante clara.

Si a todo esto unimos que la sala estaba realmente hasta arriba y era la pequeña pequeña (estarí­amos unas 60 personas de pie), pues no pude probar nada y esperaré a que cuelguen el enlace y la presentación para poder trastear algo. Algo más de organización hubiese venido muy bien y al menos salvaron los problemas técnicos que no tuvieron que ver con ellos de forma magistral.

Architecture and testability by Giorgio Sironi

Interesante conferencia a manos de Giorgio sobre la importancia del buen código y del testeo. Se centró en estos cuatro puntos principalmente: «Do dependency injection», «Avoid static methods», «Law of Demeter» y «Singleton vs. Factory».

Aunque creo que se extendió demasiado para explicar algunos conceptos que se veí­a que controlaba y haber dado más ejemplos creo que le hubiese ayudado más.

Sin lugar a dudas, me quedo con estas dos perlas: «Easy to test means easy to maintain» y «When tests are difficult to write, change the design to ease testing (listen to your tests)»

Comet: by pushing server data, we push the web forward by Philip Ross

Excelente presentación de la gente de NOLOH sobre las ventajas de comet, aunque desde un punto de vista muy superficial. Me ha gustado bastante la parte en la que han hecho especial énfasis en la historia de la tecnologí­a y su futuro por ejemplo con WebSockets, aunque los navegadores pondrán muchas trabas a no ser que mejore el asunto.

Debido a problemas técnicos iniciales y a la saturación de la conexión a internet, la charla fue más corta de lo esperado y sin ejemplos prácticos que se echaron en falta.

Finalmente mostraron algo de NOLOH Framework aunque nos quedamos con las ganas de ver más cosas interesantes.

Update: continúa leyendo el dí­a 2

XHP: una extensión para escribir PHP de forma distinta

Una de las noticias de esta semana en el mundo PHP es sin duda toda la información acerca de HipHop for PHP por parte del equipo de desarrollo de Facebook. Una de las extensiones que ha salido a la luz por parte del equipo de front-end es la que han llamado XHP y, como ellos mismos rezan, «a new way to write PHP» (una nueva forma de escribir PHP).

La explicación de cómo funciona es muy sencilla. Intentan evitar que al desarrollar la parte de frontal, cuando nos «pegamos» con el XHTML, tengamos que unir código XHTML y PHP. En el ejemplo que muestran se ve más claramente.

De un código como:


 Hello, .

 
What is your name?

Nos da como opción generar este otro:

Hello, {$_POST['name']};
} else {
 echo
 
What is your name?
; }

No voy a negar que, de primeras, XHP parece más sencillo de seguir y de generar. Eliminar los tags de apertura y cierra de PHP aligera el código en gran medida. Además, eliminamos problemas con el XSS así­ como detectar problemas por malformación de XHTML en tiempo de parsing.

A mi personalmente me sigue gustando bastante más usar un motor de plantillas. Un motor real como XTemplates (sí­, he dicho XTemplates, no smarty o similares). Separar el código PHP del HTML me parece bastante importante y necesito verlo con más claridad.

No obstante, hay que seguir el tema de cerca. Si es algo que la gente de Facebook ha visto que es necesario ya que aumenta el rendimiento, es evidente que en este tipo de entornos será uno de los puntos de referencia. Sin embargo, XHP como técnica para el resto de las webs donde no se reciban tantas peticiones como Facebook (si no recuerdo mal, sirven más doscientas mil millones de páginas al mes, sí­, sí­, 200.000.000.000), es posible que un objetivo que cumpla a primera vista es juntar el PHP con el HTML, algo que, repito, me parece bastante "sucio" si no hay una justificación clara. Pos supuesto, un motor de plantillas tiene sus desventajas, no vamos a negarlo 🙂

Lo dicho, XHP de momento me parece algo que puede provocar que el código sea más rápido pero a costa de hacerlo más guarro. Habrá que seguirle la pista para ver por dónde avanza, no lo descarto de primeras porque el objetivo de aumentar el rendimiento es muy importante, pero analizando el coste (ni monetario ni de recursos en este caso, jeje).

Enlaces:

Update: Muy muy muy interesante lo que comenta Rasmus en su web. Importante verlo.

Paseando por Facebook y LinkedIn

La verdad es que no suelo frecuentar mucho redes sociales, principalmente por el hecho de que estos últimos años, mi tiempo libre ha ido decreciendo y decreciendo hasta que casi desaparece…

Pero es agradable pasearse de vez en cuando. Yo suelo atender a Facebook y LinkedIn. Y es agradable encontrar de vez en cuando a conocidos que hace mucho tiempo que no saludas o que lo haces cuando los astros se unen en una serie de coincidencias casi irrepetibles.

Estas últimas veces que he entrado he tenido la suerte de encontrar a compañeros de carrera, amigos de hace bastante tiempo e incluso a compañeros de colegio. Y es bueno ver que la vida les va bien y puedes seguir un poco los pasos desde que «ya no nos vemos tanto».