rank-es

Están navegando por Internet y de repente se encuentran con un artículo que les gusta, o que les parece que podría generar una discusión interesante, o una estupenda charla de TED, o un vídeo de gatitos, o vayan ustedes a saber qué. ¿Qué hacen? Normalmente se leerían el artículo o verían el vídeo, pero siendo ya 2012, antes lo comparten, normalmente en Twitter o Facebook, o Tuenti, si se sienten jóvenes treintañeros.

Existe una gran proliferación de páginas web, más o menos concurridas, nacidas con la misión de servir de filtro de los enlaces que envían los usuarios con la idea de que, voto tras voto, solamente lo más interesante sobreviva, aparezca en portada y permita a los usuarios descubrir contenidos interesantes y a la vez cubra de gloria al autor del artículo original, que verá cómo las estadísticas de visitas se convierten de forma milagrosa en ríos de leche y miel. Resumiendo: Digg, Reddit, Menéame y tantos otros.

La semana pasada, inspirado por el curso de desarrollo web de Udacity, se me ocurrió intentar hacer algo parecido pero prescindiendo de usuarios que votan en un sitio dedicado al efecto. Si precisamente ya está el grueso de la gente compartiendo en Facebook o Twitter, ¿no se podrían coger de ahí las puntuaciones y hacer así la clasificación? Y así me entretuve hasta que salió algo que se pueda enseñar sin que dé (mucha) vergüenza: rank-es.

Tal y como está hecho ahora mismo, rank-es es un Menéame sin Menéame: coge las noticias de la portada y todas las que se han enviado a la cola de votaciones, aprovechando que la mayoría apuntan textos en castellano, genera una puntuación nueva y muestra los 50 mejores enlaces de acuerdo a esa métrica. Para evitar depender únicamente de lo que se envía a Menéame, también se ofrece la posibilidad de enviar enlaces mediante un campo de entrada de texto.

Como esto utiliza la versión gratuita de Google App Engine, tiene ciertas limitaciones. La página principal se actualiza cada vez que se recogen los nuevos enlaces de Menéame y se calculan las nuevas puntuaciones de los que ya hay, que es cada hora, o también cada vez que se envía un enlace a través del formulario. Los enlaces se guardan durante 24 horas y van muriendo (la puntuación tiene un modificador que decrece en función de la antigüedad de forma lineal) hasta que se retiran; también se les aplica la eutanasia forzosa a aquellos que obviamente no van a llegar al top-50 de ninguna forma. Me hubiera gustado que esto fuese más rápido o tuviese un poquito más de capacidad, pero da para lo que da.

La principal ventaja que le veo a todo este asunto es que la puntuación me parece más limpia, en el sentido en que se está recogiendo de una muestra de usuarios, a priori, mucho mayor. Por otra parte, los vídeos tienen la manía de aparecer directamente en la parte de arriba de la tabla, especialmente si están en inglés, aunque hay noticias en español muy compartidas (como ésta, que a la hora de escribir este artículo estaba en una envidiable segunda posición). También tiene la desventaja de que la puntuación se computa desde el principio de los tiempos, no desde que el enlace se añadió al sistema; esto es un claro inconveniente, pero si se emplea para compartir noticias más o menos recientes puede salvarse fácilmente eliminando los enlaces con puntuaciones demasiado altas.

En fin, que ahí queda para los curiosos. De momento es una prueba de concepto pero igual a alguien le resulta interesante. El código se puede descargar de github y si alguien tiene sugerencias estupendas sobre qué se podría hacer con esto, soy todo oídos.

DeliciousTumblrTuentiShare
Esta entrada fue publicada en Geek World. Guarda el enlace permanente.

24 respuestas a rank-es

  1. Aloriel dijo:

    Mola, seguiré la evolución del monstruito.

    PS: ¿no sería “para seguir” o “que seguir” en “Introduce una nueva URL a seguir y pulsa enter. Ya nos hacemos nosotros cargo desde ahí:”?

    • RinzeWind dijo:

      Pues sí, queda un poco raro. Directamente he quitado esa parte. Lo bueno, si breve…

      • Aloriel dijo:

        Ya de paso, no se te ha ocurrido analizar tambien G+?

        • RinzeWind dijo:

          Sí, lo miré en su momento, pero es mucho más complicado obtener la puntuación y lo utiliza mucha menos gente, así que al final decidí que no me salía a cuenta.

  2. Carlos/Artik dijo:

    Me llena de orgullo y satisfacción ver que la página que sale en primer lugar es la noticia donde se informa del “descubrimiento” del bosón de Higgs.

    ¡Ah, gatitos, habéis perdido la ronda!

    • Aloriel dijo:

      Erm, se acabo:
      55519149 Welcome to Facebook – Log In, Sign Up or Learn More
      2862773 Twitter
      100918 Free Porn Sex Videos – Redtube – XXX Movies – Home of Porno

  3. Pingback: ¿Cómo sería meneame si se le quitan los votos de los usuarios?

  4. Heli dijo:

    Si que es interesante si. :)

  5. Por diosss, ponle un rss para que me lo ponga en el lector.

    Gracias de hantebraso

  6. Carlos dijo:

    Me temo que ha llegado a portada de meneame y lo han llenado de spam. Al dejar abierta la posibilidad de que cualquiera pueda meter URLs, se ha calculado la popularidad en Facebook y Twitter de Facebook, Twitter, Google Maps, … Y superan la popularidad de cualquier noticia…

    • Pero en 24/36/48 horas los sitios que no sean nuevos aunque sean populares desaparecerán.

      Estamos viendo la explosión cretácica, un lugar nuevo donde cabe casi todo, la caducidad de 24 horas hará que lo que no sea novedad no sea noticia. Creo que es un buen algoritmo, hay que darle tiempo.

      • RinzeWind dijo:

        De todas formas he intervenido (levemente) para no dejar que se puedan enviar simplemente dominios. Tendré que afinarlo un poco más, pero por el momento aguanta.

        Como dices bien, en 24 horas todo lo que hay ahora mismo “se muere” y aparecen cosas nuevas. No se puede repetir. A la larga, todos los sitios con puntuaciones altísimas que se puedan ir añadiendo hoy terminarán pasando a la lista de los repetidos.

  7. Chuso dijo:

    Potencial tiene, yo creo que mucho.
    Primeramente una pregunta sobre la puntuación-
    el valor dado corresponde al número de veces compartido en twitter mas el número de veces compartido en Facebook? O tiene algún modificador?
    Potencialidades y añadidos-
    Yo añadiría a cada noticia unas etiquetas, de modo que con el tiempo se pudiera revisar, por ejemplo, las noticias más destacadas en ciencia durante el año 2012. Creo que lo bueno no tiene que ser efímero porque, de lo contrario acabaremos inventado la rueda miles de veces. Así que es sensato no solo puntuar la noticia según calidad, sino también tenerla a mano para su “revisión”/”referencia”.
    Utra cosa interesante, aunque no para los usuarios es guardar por separado la puntuación por twitter y la conseguida por facebook.
    Además si se revisa la puntuación cada hora, también estaría curioso salvar esa evolución temporal para un estudio “sociológico” posterior.
    Bueno… sigo de cerca el engendro porque se me irán ocurriendo más cosas (posiblemente inútiles la mayoría).
    Enhorabuena por la criatura.

    • RinzeWind dijo:

      La puntuación es Facebook + Twitter, sin más. Tiene un modificador pero depende de la antigüedad, para que las noticias se muevan un poco.

      Lo de las etiquetas y demás está bien, pero ahora mismo andamos restringidos de espacio (Google App Engine no da mucha manga ancha con los recursos que cede de forma gratuita), pero lo apunto. Y lo del seguimiento también estaría muy bien, pero eso ya lo veo más problemático: no es factible revisar la puntuación de todas las noticias incluidas en el sistema.

  8. Vicent dijo:

    Increible y super interesante. Te he añadido a favoritos e iré siguiendo el proyecto

  9. José Calvo dijo:

    Mi más sincera enhorabuena por la idea y por la web. Esto tiene un potencial enorme. Como tú dices, si los datos ya están ahí, para qué intentar crear una colectividad y que los repitan.
    Es lo más cercano a la web 3.0 que he visto. Y eso que soy profundamente escéptico con la web semántica.
    De nuevo, enhorabuena, no dejes la idea. Un saludo,
    José

  10. morri dijo:

    Me encanta la idea y también la he puesto en favoritos. Sabes como sacarle jugo a un curso, sí señor.

  11. net dijo:

    uhmmm! me recuerda a hacker news pero sin el componente geek! aún así mola.

    ciao!

  12. Algernon dijo:

    Esto es cojonudo, Rinze. :-)

  13. transeunte dijo:

    Baggg ya se crearán las mafias para votar al igual que en menéame.

  14. Pingback: ¿Cómo sería menéame si se le quitan los votos de los usuarios? | Cuéntamelo España

  15. eldios13 dijo:

    muy buena idea. como sugerencia quizas intentar meter mas feeds para que no quede “monopolizado”?

    coger el “lo mas leido” o “lo mas compartido” de varios periodicos y añadirlo? alguna forma de que no saliese la misma noticia dos veces? no se… pero me gusta!

  16. Alex dijo:

    Jaja fenomenal trabajo, eres un crack tio. Lo que me he podido partir la caja con los primeros enlaces nada mas entrar, se nota bastante que no pasan solo por el filtro de meneame, lo que mas mola. Sigue mejorandole que vas muy bien, y de que falle como una escopeta, yo no he visto nada. Un abrazo :)

  17. Pingback: Mejoras en rank-es | Las penas del Agente Smith

Los comentarios están cerrados.