De belles statistiques pour votre blog avec Piwik et Dotclear 2 - Dotclear blog décrit comment installer Piwik pour Dotclear 2. C'est donc fait sur ce blog!
jeudi, novembre 20 2008, 10:38
Comment héberger du Javascript pour un accès rapide ?
Par Jean-Pascal MILCENT - Lien permanent
Je découvre aujourd'hui sur le blog de Jquery (jQuery: » CloudFront CDN for jQuery) qu'il existe la possibilité d'héberger sur le web des données avec des temps d'accès très bas partout sur la planète.
Pour cela, il est nécessaire d'utiliser des services comme Amazon S3 ou le plus récent [Amazon CloudFront|http://aws.amazon.com/cloudfront/). Bien entendu ces services sont payant, mais peuvent être intéressant dans certain cas de figure.a
Toujours dans la même idée, je découvre que Google héberge les bibliothèque Javascript les plus connus (Jquery, Dojo, Mootols...) et permet de les charger sur son site via ses serveurs (c'est donc rapide). En outre, une version de ces bibliothèques une fois hébergé par Google le sera définitivement (du moins ils l'affirment
).
Pour cela il est nécessaire d'utiliser le Google AJAX API Loader.
lundi, novembre 17 2008, 16:20
Websvn 2.0 comment afficher correctement les caractères accentués?
Par Jean-Pascal MILCENT - Informatique - Lien permanent
Vous avez des projets encodés en ISO-8859-15 ou ISO-8859-1 et les accents apparaissent mal dans Websvn 2.0, ce petit article est fait pour vous !
mercredi, octobre 8 2008, 10:50
Tableau de bord des services Web en biodiversité
Par David DELON - Informatique et Systématique - Lien permanent
vendredi, septembre 26 2008, 11:52
Chansons pour Geek
Par Jean-Pascal MILCENT - Informatique - Lien permanent
Quelques chansons pour Geek :
jeudi, septembre 25 2008, 15:52
Dénormalisation vs Normalisation
Par David DELON - Informatique - Lien permanent
The Mother of All Database Normalization Debates on Coding Horror
A retenir : Normalize until it hurts, denormalize until it works. En gros : normaliser jusqu'à ce que se soit trop pénible, dénormaliser jusqu'à ce que ça fonctionne !
Des pistes pour nos bases de données :
- Utiliser des "materialized views" qui permettent de combiner le meilleur des deux approches.
- La dénormalisation ne devrait intervenir qu'en derniers recours, après les autres optimisations.
- La lecture physique est le goulet d'étranglement le plus grand
- Utiliser le cache applicatif
- Des queries multiples sont parfoit plus performantes que des énormes jointures.
- tout
- et son contraire ...
Voir aussi Denormalization Patterns.
mercredi, septembre 24 2008, 16:27
Liste des Wikinis de Tela Botanica
Par David DELON - Applications - Lien permanent
vendredi, septembre 12 2008, 14:03
Configuration ODBC sous MAC OS X
Par Jean-Pascal MILCENT - Informatique - Lien permanent
Configuration d'une source ODBC sous MAC OS X et son utilisation dans FileMaker Pro 9.
mardi, septembre 9 2008, 16:46
Mise en ligne de données avec TapirLink
Par Jean-Pascal MILCENT - Informatique et Systématique - Lien permanent
Utilisation de TapirLink pour mettre à disposition sous forme de service web les données publiques des projets Chorologie Départementale et Carnet en Ligne.
mercredi, juillet 30 2008, 11:55
Eclipse et Cups sous Mandiva Linux : ouverture des fichiers impossibles
Par Jean-Pascal MILCENT - Informatique - Lien permanent
De temps en temps sur ma machine, il devenait impossible d'ouvrir les fichiers de mes projets Eclipse... L'origine du problème liée à CUPS et sa solution sont présentées dans cet article.
mardi, juillet 29 2008, 17:11
Caractère de l'encodage CP1252 posant problème en ISO-8859-1
Par Jean-Pascal MILCENT - Informatique - Lien permanent
32 caractères de l'encodage CP-1252 (= Windows-1252) ne sont pas compatible avec l'ISO-8859-1. Ce sont les caractères codés de \x80 à \x9f (€ à Ÿ) : € ‚ ƒ „ … † ‡ ˆ ‰ Š ‹ Œ ‘ ’ “ ” • – — ˜ ™ š › œ Ÿ . Nous proposons de mettre en place une translittération de ces caractères...
lundi, juillet 7 2008, 22:09
Connexion de la base INPN au GBIF
Par David DELON - Informatique et Systématique - Lien permanent
Une info du Gbif France :
La base de données de l' Inventaire national du Patrimoine naturel (INPN) a été connectée au GBIF, grâce à l'aide de l'équipe du point nodal. Cette base de données d'observations de spécimens, recouvrant la France métropolitaine, est désormais à la 5ème place du classement mondial des fournisseurs de données au GBIF, avec plus de 5 millions d'enregistrements.
mercredi, juin 11 2008, 16:02
iNaturalist.org - Un outil coopératif pour les naturalistes
Par David DELON - Informatique et Systématique - Lien permanent
iNaturalist.org - Un outil coopératif pour les naturalistes : très Web2 (assemblage de Google Map pour la cartographie , de Flickr pour les photos et Wikipedia. pour le contenu), ce site, en anglais, est un projet de fin d'année de 3 étudiants de Berkeley , de très bonne idée (la timeline notamment), premier objectif : 1 000 observations !
vendredi, juin 6 2008, 14:45
Récupérer des listes de discussion Yahoo sous EZMLM
Par Jean-Pascal MILCENT - Informatique - Lien permanent
Nous allons décrire une méthode pour
- récupérer les messages de liste de discussion Yahoo dans un fichier mbox
- alimenter et créer l'index d'une liste EZMLM à partir de messages stockés dans un fichier mbox
- abonner une liste EZMLM à à une liste de discussion Yahoo.
vendredi, juin 6 2008, 10:53
OpenID
Par Jean-Pascal MILCENT - Veille technologique - Lien permanent
OpenId permet d'avoir un seul mot de passe à se souvenir pour se connecter aux sites web. Il faut bien entendu que les sites web en question autorisent une identification à partir d'un OpenId.
Si vous créez un compte sur un site fournissant un service OpenId, il vous suffira d'utiliser l'OpenId fournit pour vous connecter sur tous les autres sites web permettant une identification par OpenId. C'est assez pratique, plus besoin de se souvenir de dizaines d'identifiants ou mots de passe...
Une ressource très complète sur la façon d'implémenter OpenId en PHP.
mardi, mai 27 2008, 18:15
Des liens eflore à copier/coller
Par David DELON - Informatique et Systématique - Lien permanent
Pour faire référence à une plante de la flore en ligne de Tela Botanica, sur chaque fiche, afficher un lien "Citer", qui affichera le code HTML à copier-coller dans son blog, dans son site web ... Ainsi, le code suivant :
<a href="http://www.tela-botanica.org/eflore/BDNFF/nn/182" target="_blank">Erable de Montpellier
<img src="http://www.tela-botanica.org/cel/www/org.tela_botanica.Cel/tela.gif" border="none" alt="Erable de Montpellier" /></a>
Affichera
Erable de Montpellier
dimanche, mai 25 2008, 20:09
L'indexation des fiches d'eFlore
Par Jean-Pascal MILCENT - Informatique et Systématique - Lien permanent
Les fiches sur les taxons présentent dans l'interface web eFlore sont très peu référencées dans Google et les autres moteurs de recherches. Ceci est dû à plusieurs problèmes :
- des pages dynamiques accessibles via un formulaire
- des adresses web ayant une forme suggérant que la page html est dans un dossier profond du site (plus de deux dossiers) : http://www.tela-botanica.org/eflore/BDNFF/4.02/nn/68767
- pas de nom latin dans l'adresse web
Pour résoudre ce problème nous allons tenter l'utilisation de fichiers sitemap. Sitemap est un protocole utilisé par les principaux moteurs de recherche pour découvrir les pages qu'ils peuvent explorer, leurs fréquences de mise à jour, leurs dates de dernière modification... Si Sitemap n'était pas suffisant, nous envisagerons la modification des URLs d'eFlore. Bien entendu, nous préserverons l'accès via les liens actuels par un mécanisme de redirection transparent pour l'utilisateur.
Mise à jour du 27 mai 2008
Voilà, les fichiers Sitemap sont en place sur le serveur de Tela Botanica. Ils ont été enregistrés auprès de Google, Yahoo, LiveSearch (Mircrosoft) et Ask.com.
Le fichier robots.txt qui fournit des informations aux robots qui indexent le web indique aussi la présence de ces fichiers.
L'ensemble des fiches des taxons pour les projets BDNFF, BDAFN, BDNBE et BDNFM sont indiquées. Cela représente pas moins de 265 595 pages!
Ils nous restent maintenant plus qu'à attendre et voir...
dimanche, mai 25 2008, 19:55
Les lexiques des LSID du TDWG
Par Jean-Pascal MILCENT - Informatique et Systématique - Lien permanent
Tout d'abord quelques petites explications sur ce titre me semblent nécessaires. C'est quoi le LSID et le TDWG?
Le LSID, pour faire court, signifie "Life Science Identifiers". C'est une façon de nommer et de trouver de l'information liées aux sciences de la vie sur le web.
Le TDWG (Taxonomic Database Working Group), est un groupement international à but non lucratif qui vise à développer des standards et des protocoles pour partager des données sur la biodiversité. Une institution qui est là pour nous faciliter la vie, nous travailleurs de la base de données naturalistes! Alors, voyons voir un peu ce qu'il nous propose dans le cadre des LSID...
Les lexiques des LSID sont les éléments constitutifs de l'ontologie globale du TDWG. Ils fournissent les informations nécessaire pour décrire les objets échangés dans la communauté des organismes gestionnaire de données sur la biodiverstié. La première utilisation de ce vocabulaire a eut lieu dans le cadre du mécanisme de résolution des LSID - d'où son nom -, mais ils peuvent être utilisés dans n'importe quel format XML ou technologie du Web sémantique, afin d'exprimer les notions liées à la biodiversité.
Ce qui m'a semblé réellement intéressant dans cet énorme travail, c'est la mise à disposition libre et gratuite, d'informations sur la façon de structurer des informations. Il existe déjà de disponible plusieurs ontologies tels que :
D'autres sont encore en travaux :
- Personne
- Équipe
- Citation de publication
- Institution
- Collection
Toutes ces ontologies sont gérées à l'aide d'un gestionnaire de version de fichiers et selon un protocole clairement définit et accessible.
Les normes de structuration de l'information naturaliste qui sont proposées par le TDWG peuvent, par exemple, nous permettre de mettre en place des services web permettant à deux sites web de se communiquer des informations entre eux. Mais elles vont surtout nous guider sur la façon de structurer nos données au sein de nos propres bases de données.
Disposer de tels documents peut nous faire gagner énormément de temps
Source :
- TDWG : http://www.tdwg.org/
- LSID : http://en.wikipedia.org/wiki/LSID
jeudi, mai 22 2008, 10:55
Accès d'essai gratuit à Aluka jusqu'au 30 Juin 2008
Par David DELON - Informatique et Systématique - Lien permanent
Pour les amateurs de botanique, tous les types, holotypes, isotypes, lectotypes... que vous recherchez sont disponibles gratuitement en téléchargement, jusqu'au 30 juin 2008, sur le site Aluka
Profitez-en ! Accéder au visualisateur haute définition, aux métadonnées, aux vues agrandies, aux descriptions... juste en vous inscrivant gratuitement.
Information transmise par Philippe Birnbaum via Maryline.
mardi, mai 20 2008, 00:03
Installation et test de Tapirlink
Par David DELON - Veille technologique - Lien permanent
Tapirlink est une application Web, distribuée par le TDWG, pour fournir des ressources compatible TAPIR, à partir d'un modèle de données existant. Chaque ressource est définie par l'établissement d'une relation (mapping) entre celle-ci et la ou les tables du modèle de donnée correspondant, permettant ainsi, sans programmation, de rendre accessible des informations relatives à la biodiversité ou concernant la gestion de collections naturalistes dans un format standard d'échange de donnée (ABCD, DarwinCore).
Pas de problème particulier lors de l'installation, si ce n'est dans l'organisation du code source : en théorie seuls les répertoires www et admin doivent être visibles depuis le Web, mais cette configuration requière la création d'un sous-domaine pour être véritablement "propre", option que je n'ai pas retenu; du coup tous les utilitaires de l'application sont accessibles. Il est conseillé de protéger le répertoire admin par un .htaccess.
Suite à un message bloquant concernant la gestion des sessions, j'ai supprimé ce contrôle dans classes/TpConfigManager.php
/*
// Check that session cookie path exists and is writable
$session_save_path = session_save_path();
$session_dir_ok = false;
$msg = 'Session directory ('.$session_save_path.') ';
if ( empty( $session_save_path ) )
{
$msg .= 'is not defined';
TpDiagnostics::Append( DC_SERVER_SETUP_ERROR, $msg, DIAG_FATAL );
}
else if ( ! file_exists( $session_save_path ) )
{
$msg .= 'does not exist';
TpDiagnostics::Append( DC_SERVER_SETUP_ERROR, $msg, DIAG_FATAL );
}
else if ( ! is_readable( $session_save_path ) )
{
$msg .= 'is not readable';
TpDiagnostics::Append( DC_SERVER_SETUP_ERROR, $msg, DIAG_FATAL );
}
// TODO: this may not be necessary in UNIX FS
else if ( ! is_writable( $session_save_path ) )
{
$msg .= 'is not writable';
TpDiagnostics::Append( DC_SERVER_SETUP_ERROR, $msg, DIAG_FATAL );
}
else
{
$session_dir_ok = true;
}
if ( ! $session_dir_ok )
{
$error_msg = 'PHP session control is not working properly (check in '.
'your PHP configuration if session support is enabled, '.
'and also if session.save_path exists and is writable by '.
'the webserver)';
TpDiagnostics::Append( DC_SERVER_SETUP_ERROR, $error_msg, DIAG_FATAL );
}
*/
Un test rapide montre que tout semble fonctionner correctement ensuite :
Démarrage :

Ajout d'une ressource Tapir :

Description de la ressource :

Choix du format de sortie :

Mapping (mise en correspondance :

TapirLink permet ensuite de déclarer les ressources ainsi crées (à vérifier) et offre toute un lot de services : recherche, log des connexions, LSID resolver (?) etc.
Conclusion : un outil très puissant qui simplifie grandement la mise à disposition de données et permet de se concentrer sur la mise en correspondance des données ce qui n'est pas une mince affaire.
« billets précédents - page 1 de 3