Pivoter avec des éléments techniques – les MOOCs du Hamas

Pivoter avec des éléments techniques – les MOOCs du Hamas

Cet article a été réalisé sur la base du travail de recherches en sources ouvertes des participants à la dernière formation généraliste OpenFacto fin juin 2019. Elle est le fruit des deux jours de formation et d’un travail collaboratif de groupe de fin de stage sur un sujet non résolu.

Le Hamas lance une campagne de levée de fonds bitcoin

Le 31 janvier 2019, les Brigades d’Al Qassam, la branche armée du Hamas considérée comme un groupe terroriste par les Etats-Unis, l’UE et d’autres pays, lancent une campagne de soutien de ses forces en bitcoin avec la promotion sur ses supports de communication de l’adresse suivante : 3PajPWymUexhewHPczmLQ8CMYatKAGNj3y.

Quelques visuels de la campagne de levée de fonds du Hamas
Le site donne à présent une adresse BTC unique aux sympathisants pour effectuer leurs transferts

Cette campagne est notamment étudiée en détail par plusieurs analystes OSINT comme Ghost Security Group qui analyse le circuit crypto en février 2019.

Analyse graphique par @RaijinRising de Ghost Security Group

Bellingcat en fera un tutorial sur la recherche sur les crypto-monnaies en utilisant le cas spécifique des Brigades Al Qassam en mars 2019.

Rebondir du Hamas à un MOOC: l’adresse bitcoin

En réalisant une simple recherche de l’adresse bitcoin des Brigades Al Qassam sur le moteur de recherche Google, on découvre parmi les résultats le site internet d’une école islamique en ligne : la Islamic Digital School/ Ahmed Yassine Institute. L’adresse BTC retrouvée sur le site pour faire des dons à l’école, semble être la même que celle utilisée par les Brigades Al Qassam, affiliée au Hamas.

Visuel que l’on retrouve à cette adresse  et archive

Pivoter à partir des éléments techniques

Avec comme point de départ un site internet, on peut observer et rechercher plusieurs éléments afin de trouver de nouveaux indices pour rebondir et pivoter sur la suite.

On commence donc par observer la conception du site en se demandant si la qualité est au rendez-vous, si on comprend à quoi il sert, dans quelle langue il est écrit. On repère aussi les emails, les numéros de téléphone, les adresses physiques, les liens vers les réseaux sociaux et les images. Parfois en basculant sur une autre langue, le site peut s’avérer plus complet.

Dans notre cas, le site internet ressemble à une page de blog déroulante écrite en anglais et en arabe. La mission de l’Institut Ahmed Yassine – le chef spirituel du Hamas – est d’être la première école en ligne sur l’islam. L’école dispense un cursus de formation sur l’Islam avec la remise d’un diplôme.

site de l’Institut Ahmed Yassine

On peut ensuite prendre le nom de domaine/url « ahmedyassineinstitute.com » et faire une recherche whois et un traceroute en utilisant le site ping. Le WHOIS permet d’obtenir des informations sur le propriétaire du site et sur la société qui héberge le site. Les informations sont devenues de plus en plus rare depuis la loi sur le Règlement Général sur la Protection des Données personnelles (RGPD). Un traceroute permet de voir le chemin que prend un paquet de données pour aller de sa machine au serveur qui héberge le site en question.

WHOIS du site internet
Traceroute qui nous amène au Royaume Uni

Le domaine est enregistré par une société américaine depuis le 18 Septembre 2018 avec deux adresses IP localisées en Angleterre (188.241.39.12 et 188.241.39.10). En utilisant Exonerator, on constate que ces adresses ne sont a priori pas utilisées comme relai par TOR.

Ensuite il est crucial de rechercher des mentions du site ailleurs sur internet pour voir où il apparaît et si cela peut nous aider à rebondir sur d’autres éléments d’intérêt. Une recherche de l’URL avec le dork suivant intext: »ahmedyassineinstitute.com » sur les moteurs de recherche mène à une discussion sur Reddit et une page Facebook sous le nom de Islamic Digital School.

La conversation sur Reddit débat de la véracité du site internet et de la page Facebook indiquant qu’il pourrait s’agir d’une tentative de déstabilisation de la République Tchèque et de la Slovaquie par l’extrême droite ou les russes.

La page Facebook fait bien référence au site initial et se présente également comme une école sur l’islam en ligne. La page Facebook est postérieure au site et a été créée en octobre 2018.

Elle cible la population tchèque et slovaque car elle propose les cours dans la langue. La page est gérée par deux comptes facebook localisés en Angleterre. Il n’y a pas plus d’éléments exploitables à ce stade. Il est intéressant de noter que les statistiques du site internet sont très basses (le site n’est pas classé) tandis que le nombre de followers sur la page Facebook atteint + 5600.

Le code source de la page permet de regarder comment le site est construit. Sans être expert, il peut être utile de rechercher par exemple un tracker UA (Google-Analytics) qui est utilisé dans l’analyse de trafic du site par un webmaster pouvant déboucher sur d’autres sites administrés par la même personne. Dans notre cas, il n’y a rien.

L’étude des photos est aussi intéressante pour savoir s’il s’agit de photos de banques d’images ou des photos originales. Avec un reverse image ou en regardant le code, on peut vite se rendre compte de quoi il s’agit.

ici on peut voir que de photo (.jpg) proviennent d’un site ethnews.com et d’une banque d’images 123rf.com
En faisant un reverse image d’une autre photo, on voit qu’elle est très répandue en ligne

Enfin, il s’agit de regarder tous liens qui peuvent être tirés d’une adresse physique, d’un numéro de téléphone, d’un email pour continuer à pivoter vers de nouveaux éléments. Dans notre cas, on retrouve un email sur le nom de domaine  – et un email personnel associé à un certain Zaki Qishawi. En basculant le site en langue arabe on peut aussi obtenir l’écriture exacte: زكي قيشاوي.

La même technique peut être utilisée pour pivoter par la suite sur ces emails :

  • 1) recherche de la mention de l’email en ligne,
  • 2) utilisation de cet email sur les réseaux sociaux
  • 3) décomposer l’email en user name – ici zaky007 pour voir s’il apparaît quelque part
  • 4) chercher en anglais et dans la langue d’origine les mentions du nom complet de la personne pour rebondir sur les réseaux sociaux, les réseaux professionnels et voir si des liens peuvent être tirés.

Ici et sans rentrer dans une recherche approfondie sur cette personne, le même email est utilisé en 2012 sur un forum par un individu avec un pseudo concordant cherchant à vendre des panneaux solaires.

Premières conclusions basées sur les éléments techniques d’un site internet

A partir d’un lien entre une adresse bitcoin attribué au Hamas et un nouveau site internet, on voit bien qu’en se concentrant uniquement sur ce site internet de façon méthodologique, nous pouvons tirer des informations qui permettent de rebondir:

  • site dont le thème principal est la formation en ligne sur l’islam et qui fait référence au guide spirituel du Hamas
  • site en langue arabe et anglaise de facture moyenne
  • site hébergé sur des serveurs au Royaume-Uni
  • site dont on discute dans le contexte de la Slovaquie et la République Tchèque dans lesquels les communautés musulmanes locales sont chahutées avec un fort sentiment anti-musulman en République Tchèque et des lois controversées en Slovaquie.
  • Page Facebook du site qui est administré par deux comptes localisés au Royaume Uni
  • Un email lié à une personne et un nom qui sont mentionnés sur internet et les réseaux sociaux.

On pourrait donc imaginer que l’étape suivante serait de se concentrer sur l’email et l’identité de l’individu mentionné sur le site, ainsi que sur la mention de cette initiative dans les géographies qui apparaissent dans la conversation Reddit.

OSINT : le cas du traitement de la presse vietnamienne (1ère partie)

OSINT : le cas du traitement de la presse vietnamienne (1ère partie)

De la nécessaire maîtrise de la langue, de la culture et des codes dans les opérations…

Mon premier contact avec la presse vietnamienne remonte à plus de 25 ans alors que j’étais étudiant en langue à l’Ecole Supérieure de Langues Etrangères de Hanoi. Outil d’apprentissage de la langue pour l’acquisition du vocabulaire, économique d’abord, cette presse devint progressivement un vecteur d’appréhension et de compréhension progressif de l’environnement informationnel ambiant qui m’entourait et dans lequel je baignais. Cette ouverture sur cet écosystème informationnel se structura ensuite de par les activités que j’occupai à la Chancellerie Politique de l’Ambassade de France au Vietnam (1995 – 1998) où il m’était demandé, entre autres, de « brosser » de façon quotidienne un tableau informationnel des éléments publiés dans la presse vietnamienne de langue vietnamienne. Expérience qui dura 3 ans et qui fut prolongée par la mise en place à la fin des années 90 d’une petite structure (en partenariat avec l’Association des Journalistes du Vietnam et le Press Club de Hanoi) de vente d’informations aux acteurs économiques étrangers opérant au Vietnam.

Cette approche « opérationnelle » de la presse vietnamienne fit l’objet de la première partie de ma thèse soutenue en 2005 à l’Institut National des Langues et Civilisations Orientales. Thèse de Doctorat ayant pour titre : « Genèse, situation actuelle et perspectives d’avenir des Compagnies Générales (Tổng Công ty) en République Socialiste du Viêtnam à travers les sources viêtnamiennes1

1 Voir Eglinger, Jean-Philippe, Genèse, situation actuelle et perspectives d’avenir des Compagnies Générales (Tổng Công ty) en République Socialiste du Viêtnam à travers les sources vietnamiennes, thèse de doctorat,Paris, INALCO, avril 2005.

Pourquoi alors revenir sur ce sujet quelque 25 années plus tard? Car il est plus que d’actualité pour une personne ou une organisation qui souhaite appréhender l’environnement d’un pays où le système politique se sert de cet outil comme porte voix direct auprès de sa population. Traiter à la source l’information permet de détecter les signaux faibles ; pouvoir comprendre l’angle d’approche et surtout la manière dont les autorités souhaitent voir sa population réagir face à un problème évoqué, ce sans être obligé de poser trop de questions est un réel avantage. Tout cela effectué dans la langue et la culture vietnamiennes pour optimiser l’efficacité du discours et donc l’impact de l’influence. L’important ici étant moins l’information en elle-même que la source qui la traite et la manière dont elle est traitée. Et c’est bien là tout l’avantage de pouvoir directement approcher et analyser cette presse dont certains pensent qu’elle ne présente pas d’intérêt car elle est dirigée… Cette direction indiquée, précédemment évoquée, nous donne les clefs de décryptage car cet outil est éminemment politique.

La presse au Vietnam : un écosystème au service des autorités du pays

  • Statut actuel :

Dans un article publié par la revue Công Lý (Justice) du 28 décembre 20181, présentant le rapport des activités de la presse institutionnelle vietnamienne 2 en décembre 2018, M. Lê Mạnh Hùng, vice président de la Commission Centrale de la Propagande et de l’Education a indiqué qu’en novembre 2018, il y avait environ 19 000 journalistes détenteurs d’une carte de presse; que le nombre d’adhérents à l’Association des Journalistes du Vietnam s’élevait à 23 893 personnes. Le Vietnam compte quelque 844 organes de presse avec 184 journaux, 660 revues et 24 organes de presse électroniques indépendants.

Quelque 189 licences autorisant la mise en place de sites d’information internet ont été attribuées aux organes de presse, de diffusion ou de télévision. Le Vietnam compte 67 radios ou chaînes de télévision et 35 entreprises évoluant dans le domaine de services de diffusion ou télédiffusion.

Ce secteur de la presse représentait en 2018 un marché de 15 840 milliards de VND (environ 610 millions d’euros). Le chiffre d’affaires des journaux imprimés et électroniques se montait à 4 900 milliards de VND (soit 188 millions d’euros). Et le chiffre d’affaires des Radio et télévision représentait 10 940 milliards de VND (420,6 millions d’euros) avec une part de recettes de 9 631 milliards de VND (370 millions).

A noter que depuis la fin des années 80, le modèle économique des média vietnamiens s’est libéralisé et que le secteur privé est désormais autorisé à investir dans certaines publications à vocation de « loisir« .

Enfin, à noter qu’à côté de cette presse nationale vietnamienne, il existe de nombreuses publications ou blogs tenus par des Việt Kiều (Vietnamiens résidant à l’étranger) et souvent hostiles à la politique des dirigeants du Vietnam.

1 http://congly.vn/thoi-su/hoi-nghi-bao-chi-toan-quoc-tong-ket-cong-tac-nam-2018-trien-khai-nhiem-vu-nam-2019-281918.html

2 Il est intéressant de voir qu’en vietnamien le terme « báo chí » (journal) englobe l’ensemble des activités de la presse

  • Bref Historique

Dans son ouvrage, Thư tịch Báo Chí Việt Nam1, M. Tô Huy Rứa2 indique que « le journalisme est apparu au Vietnam juste après l’invasion des ‘Colonialistes’ français ». La première publication vietnamienne, aux yeux des autorités de Hà Nội, semble rester le journal Gia Định báo. Ce journal écrit en quốc ngữ 1 fut fondé à Sài Gòn le 15 avril 1865 sur décision du gouvernement français de Cochinchine. Le développement de la presse au Vietnam connu un essor dans les années 1910 – 1920, date à laquelle des parutions créées par des intellectuels vietnamiens qui décidèrent de favoriser la diffusion du savoir par voie de presse virent le jour. Des publications comme Nam Phong écrites en quốc ngữ2, français et chinois étaient soutenues par les autorités coloniales françaises afin de défendre les intérêts et la culture française et influencer les populations.

1 Nhà xuất Bản Chính trị Quốc gia, 1998

2 Alors président de l’Institut Politique Hồ Chí Minh

1 Langue nationale fondée sur les caractères latins
2 Journal fondé par Phạm Quỳnh et Louis Marty en janvier 1917.

Tout comme le Nam Phong, l’hebdomadaire Đông Dương Tạp chí1 fondé par le Français Schneider et dont le rédacteur en chef était Nguyễn Văn Vĩnh axait sa ligne éditoriale sur la vulgarisation de la culture tant vietnamienne qu’occidentale… D’autres journaux plus littéraires firent leur apparition comme le Phong Hoá Tuần báo2 fondé par Nguyễn Tường Tam (Nhật Linh) à son retour de France en 1932. Une des caractéristiques de ce journal était qu’il était animé par une équipe de jeunes écrivains et poètes qui fondèrent un groupe littéraire, le Tự lực Văn đoàn3 résolument « moderne ».

Parallèlement à cette presse « autorisée », s’est développé dans les années 30 – 40 une presse vietnamienne d’Outre-mer4, créée par Nguyễn Ái Quốc5 et qui comprenait les principaux titres suivants : Thanh Niên, Công nông, Lính khách mệnh. D’autres sensibilités étaient également représentées comme celle du nationaliste Nguyễn An Ninh avec son titre « La Cloche fêlée », Ce sont là les prémisses de la presse révolutionnaire vietnamienne de différentes obédiences (Communiste, nationaliste, trotskyste) qui a permis l’essor du journalisme connu sous le terme de Làng Báo Chí (Village de la Presse)… Qui aussi bien les journaux autorisés que les premières revues communistes ont eu pour effet immédiat de contribuer à enseigner et de propager à grande échelle le quốc ngữ dont l’usage était jusqu’alors resté limité… Dès son apparition, il est frappant de constater que la presse vietnamienne a toujours été un enjeu de pouvoir dont le but était de convaincre ses lecteurs du bien fondé des causes qu’elles incarnaient et défendaient quelles fussent littéraires, politiques, linguistiques ou culturelles. Le président Hồ Chí Minh aimait effectivement à rappeler que « le journaliste est le soldat, le papier et la plume sont des armes ». Cette arme qui fut nécessaire à la lutte pour l’indépendance continue maintenant à être utilisée pour canaliser les énergies à « l’édification du Socialisme, à la poursuite de l’industrialisation et de la modernisation du Vietnam » tout en renforçant « la solidarité idéologique, politique et spirituelle parmi la population6 »

1 15 mai 1913 – 15 juin 1919

2 16 juin 1932 – 5 juin 1936.

3 Regroupant, entre autres, les auteurs suivants : Nhật Linh, Tô Ngọc Vân, Khai Hưng, etc.

4 Base d’Edition à Canton. D’autres journaux communistes vietnamiens furent implantés en Chine (Shanghai) « Đỏ » du Đảng Cộng sản An Nam, en France, …

5 Hồ Chí Minh

6 Directive 22/CT-TW du 17 octobre 1997

  • Les liens avec le monde politique

Historiquement et par nature, la presse au Vietnam est fortement liée au pouvoir politique en place et les contrôles s’organisent de façon institutionnelle selon le schéma (simplifié) suivant :

Source : Travaux personnels

La nécessaire prise en compte de la « grille de lecture » politique, économique, culturelle pour optimiser son utilisation opérationnelle.

Cette imbrication qui existe entre la presse vietnamienne et les autorités politiques est double : d’une part, la presse institutionnelle est placée directement sous le contrôle des autorités qui s’en servent de porte voix. D’autre part, la presse contestataire Việt Kiều, donne en creux des éléments d’information supplémentaires à ceux indiqués par la presse institutionnelle. Si à cela, on ajoute que la presse institutionnelle est multiple en raison des différents organes de rattachement des publications, on commence à voir que cet écosystème d’informations n’est pas si monolithique qu’annoncé. Contredisant la phrase « solennelle » si souvent entendue : « de toute façon la presse vietnamienne est dirigée, il n’y a donc rien à en tirer »… Certes, la presse vietnamienne est dirigée, et c’est justement pour cela qu’elle est intéressante et qu’elle « dit ». La question est de savoir si nous savons/pouvons « entendre ». Sachant « qu’entendre » ne signifie aucunement « partager le point de vue »… Et pour entendre il faut vouloir (essayer) de comprendre et être en mesure de décrypter cette presse dans son environnement politique, linguistique et culturel. Et c’est seulement dans cet état d’esprit que l’on pourra être en mesure d’appréhender les éléments qu’elle révèle, ce selon un cheminement souvent très cadré.

  1. En premier lieu, la presse une fois qu’elle y est autorisée, identifie un sujet via une publication dans certains journaux phares (au plus proche des autorités politiques (Cf. Partie 3), ou bien, en creux ignore, un problème par non révélation ou retrait de publication. C’est là le premier signal faible à détecter. Voir si le fait qui existait est révélé, ignoré, ou abandonné.
  2. Le deuxième point est de bien comprendre comment ce point révélé est abordé. Quel est son éclairage. Et sa contextualisation dans l’environnement vietnamien est capital. Les pondérations « d’importance » de l’information ne sont pas forcément les mêmes dans cet environnement que dans le nôtre.
  3. Le troisième point à prendre en compte est la solution que l’article propose pour gérer le problème exposé. Quel est le chemin à prendre, à suivre pour entrer dans la gestion « autorisée » de la situation ?
  4. Enfin, le dernier point, en guise de conclusion, est l’enseignement à retirer de la situation décrite. Ce qu’il faut en retenir afin de ne pas se retrouver confronté aux mêmes difficultés dans l’avenir.

Cette approche très pédagogique permet à celui qui maîtrise les éléments du « puzzle » donnés par la presse de dégager les éléments principaux pour tenter de reconstituer le tableau à partir des pièces éparses collectée…

Et ceci demande une connaissance fine de l’écosystème des organes de publication de la presse au Vietnam. En effet, « Qui dit quoi ? » Quelle est la hiérarchie à établir entre les publications ? Par exemple lorsque le journal Nhân Dân (Le Peuple) dont l’organe de Tutelle est le Parti Communiste, publie une information, on peut de facto en déduire que cette information est de première importance pour les autorités. La source avant l’information… On sait également que ce journal étant près des autorités de censure, il sait ce qu’il ne peut pas écrire donc ce sera lui qui en « dira » le plus. C’est une lecture en creux en quelque sorte…

Un autre exemple, lorsque le journal Đầu Tư (organe de tutelle : le Ministère du Plan et de l’Investissement) traite, par exemple, d’un cas de corruption (par exemple) et que le journal Công Thương (organe de tutelle le Ministère de l’Industrie et du Commerce) y répond si un agent de son ministère est mis en cause, on peut compter glaner un certains nombre d’informations autour de ces échanges par presse interposée. Ceci est valable pour d’autres acteurs politiques qui souvent font l’objet d’attaques dans les campagnes de lutte contre la corruption qui sont un moyen pour un clan d’attaquer un autre clan. Le récent exemple de l’attaque du Maire de Hanoi, M. Nguyễn Đức Chung par les partisans du Premier Ministre M. Nguyễn Xuân Phúc est un bon exemple.

A noter que ces articles sont de plus en plus relayés par les éditions électroniques des journaux plus réactives que la presse papier. Cette dernière gardant un avantage lorsqu’il s’agit de traiter des articles de fond sur une durée plus longue.

Cette presse soumise à la tutelle de ses organes est également dépendante de son lectorat. La baisse du nombre des publications papiers depuis les années 80 en atteste. La presse doit donc non seulement se « conformer » aux directives des ses organismes de tutelle mais également satisfaire les besoins d’information de la population, notamment urbaine, bien plus informée que nous pouvons le croire en Occident. Cette presse ne peut donc pas trop se déjuger. Il existe également un « garde fou », limité certes mais bien présent, qui cadre également la manière dont l’information est présentée.

Ces éléments mis en place permettent, via la mise en perspective de l’information, d’élaborer des scenarii « plausibles » en confrontant cet « environnement informationnel » aux contraintes de l’environnement vietnamien. Ce scenario peut-il entrer dans le cadre d’un écosystème contraint ou non ? Quelles sont les implications dans l’environnement vietnamien ? Etc. Sachant qu’il existe toujours des « fils invisibles » qui nous échappent.

Une fois cette étape franchie, se met en place alors la nécessaire étape de « translittération informationnelle » qui permet une fois les scenarii établi et validé dans l’écosystème vietnamien de le « transformer » en éléments recevables pour le lecteur étranger à l’écosystème. Et ce, n’est pas forcément la partie la plus simple à réaliser. Rendre intelligible une situation « cross culturelle » demande une véritable pédagogie afin d’éviter la situation de rejet souvent exprimée par : « ce n’est pas possible »…

Mais c’est un autre sujet qui ne relève pas du présent article…

Firefox (I) – Les outils de développement de Firefox

Firefox (I) – Les outils de développement de Firefox

Ce billet est le premier billet d’une série sur le navigateur Firefox.

Si je dois bien vous avouer quelque chose, c’est que je n’ai jamais compris la hype, l’engouement autour du navigateur Chrome de Google. En 2012 ou 2013, considérer ce navigateur internet comme le must en la matière pouvait encore se comprendre, à l’heure où ses performances surpassaient celle de Firefox.
Mais depuis l’arrivée de la version 6x, ce dernier est désormais une bête de course et sa gestion de la mémoire le rend diaboliquement efficace.

Bien plus que ses performances pures, c’est surtout sur le plan du respect de la vie privée que Firefox est remarquable. Or, lorsque l’on effectue des recherches en sources ouvertes, il est indispensable de garder la main sur nos données privées et leur éventuelle fuite lors de la navigation. C’est donc bien évidemment ce navigateur qu’OpenFacto recommande à ses lecteurs et membres! Et si vous voulez utiliser Chrome, nous vous encourageons à utiliser Chromium, sa version libre, expurgée des mouchards Google.

Au delà de ces aspects, comprendre la manière dont votre navigateur interagit avec le site internet que vous visitez est essentiel. Un des outils disponibles dans Firefox, particulièrement utile à l’OSINT, est l’outil de Développement Web (il est aussi disponible sous Chromium, rassurez-vous).
Il est activable par la combinaison de touches CTRL+MAJ+I, ce qui devrait faire apparaître la barre ci-dessous.

Avec cet outil, il est possible d’examiner plusieurs éléments et notamment :

  • Le code source de la page avec l’Inspecteur
  • Ce que le site stocke en local sur votre navigateur avec le Stockage
  • Les échanges entre le navigateur et le site distant avec le Réseau

Nous ne nous étendrons pas sur les autres paramètres pour l’instant et c’est sur l’aspect Réseau que nous nous attardons aujourd’hui.

L’outil Réseau – Usage simple

Prenons un exemple pour illustrer à quoi peut bien servir l’outil Réseau.
Imaginons que nous recherchions des informations sur la société OVH (dont le numéro RCS est 424761419), sur le site societe.com.

Si on entre ce numéro dans la barre de recherche, le site donne immédiatement le résultat, mais on ne comprend pas bien comment s’opère cette recherche, comment on obtient ce résultat. La barre d’URL ne donne aucune indication sur la nature de la requête.

Essayons donc d’effectuer cette même requête avec l’outil d’analyse Réseau de Firefox.

On observe que dès que nous appuyons sur l’outil de recherche, le site internet lance une requête de type GET, avec une URL formatée ainsi :

https://www.societe.com/cgi-bin/search?champs=424761419

On comprend dès lors que le site internet utilise une requête spécifique pour afficher cette page, composée d’une chaîne de texte (une URL) se terminant par le signe « égal », auquel il a concaténé le numéro RCS que l’on avait donné.

Pour vérifier notre hypothèse, essayons donc d’effectuer une recherche sur le numéro RCS de GANDI sans passer par la page principale du site, mais en tapant directement l’URL :

https://www.societe.com/cgi-bin/search?champs=423093459

Bingo! Cette URL est fonctionnelle.
On peut également tenter de rechercher par nom et prénom :

https://www.societe.com/cgi-bin/search?champs=martin+bouygues

Mais vous me direz, quel usage pour l’OSINT?

Simple… Supposons que vous ayez une feuille de calcul de type tableur, avec une liste de 20 ou 800+ numéros RCS. Il est alors très simple de composer une colonne supplémentaire à votre tableau en concaténant l’URL que vous avez découverte, et ces numéros… et d’envisager ainsi des possibilités d’automatiser la consultation de ces pages!…

L’outil Réseau – Usage avancé

L’outil réseau permet de récupérer rapidement dans certains cas de l’information très utile, notamment lorsque le site internet est dynamique, ou s’interface avec une base de données.


Prenons l’exemple de cette page issue du site du Tribunal Spécial pour le Liban :
https://www.stl-tsl.org/en/the-cases/contempt-cases/stl-14-05/filings?&case=6&dtype=1

Cette page présente une liste de 20 documents dont on aimerait récupérer les métadonnées (date, titre, etc…), le plus efficacement possible.
Ouvrons cette page à l’aide des outils de développement de Firefox.

Nous allons filtrer la vue en cliquant sur XHR (XMLHTTP Request), un système permettant à un site internet de rafraîchir ses données de manière dynamique en Javascript. Pour récupérer et afficher ses données, le site va se baser sur un fichier de type JSON (un simple fichier texte balisé) contenant les metadonnées que nous cherchons, et les mettre en page à la volée. C’est ce fichier qui nous intéresse.
Si nous sélectionnons la ligne URL contenant le fichier Json, et observons la « réponse » à droite de la fenêtre, on constate que ces metadonnées sont bien présentes.

Comment récupérer ces données?
Il suffit par exemple de cliquer bouton-droit sur la ligne ainsi sélectionnées et de cliquer sur « Copier comme cURL ». Si vous ouvrez un terminal et collez le contenu du presse-papier, vous devriez observer ceci :

curl 'https://www.stl-tsl.org/crs/index.php/home/filings/??&case=6&dtype=1&case=6&dtype=1&p=0&pp=20&lang=1' -H 'User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:68.0) Gecko/20100101 Firefox/68.0' -H 'Accept: /' -H 'Accept-Language: fr,fr-FR;q=0.8,en-US;q=0.5,en;q=0.3' --compressed -H 'X-Requested-With: XMLHttpRequest' -H 'Connection: keep-alive' -H 'Referer: https://www.stl-tsl.org/en/the-cases/contempt-cases/stl-14-05/filings?&case=6&dtype=1' -H 'Cookie: visid_incap_114829=kUHENy7IT4u+MpclqtAvkJOkKF0AAAAAQkIPAAAAAACARMONAVOOktY/aYDphOnUIQ9OWSIRGc7M; language=en; incap_ses_475_114829=3podc9DOQDBo2Y1TI4qXBgfoR10AAAAAtolh2LpK1l+icEJ+YnmlUg==' -H 'TE: Trailers'

Ajoutons une redirection vers un nom de fichier en complétant cette commande par > metadata.json :

curl 'https://www.stl-tsl.org/crs/index.php/home/filings/??&case=6&dtype=1&case=6&dtype=1&p=0&pp=20&lang=1' -H 'User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:68.0) Gecko/20100101 Firefox/68.0' -H 'Accept: /' -H 'Accept-Language: fr,fr-FR;q=0.8,en-US;q=0.5,en;q=0.3' --compressed -H 'X-Requested-With: XMLHttpRequest' -H 'Connection: keep-alive' -H 'Referer: https://www.stl-tsl.org/en/the-cases/contempt-cases/stl-14-05/filings?&case=6&dtype=1' -H 'Cookie: visid_incap_114829=kUHENy7IT4u+MpclqtAvkJOkKF0AAAAAQkIPAAAAAACARMONAVOOktY/aYDphOnUIQ9OWSIRGc7M; language=en; incap_ses_475_114829=3podc9DOQDBo2Y1TI4qXBgfoR10AAAAAtolh2LpK1l+icEJ+YnmlUg==' -H 'TE: Trailers' > metadata.json

On obtient alors un fichier ressemblant à ceci (extrait) :

{"count":3352,"data":[{"id":4166,"title":"Order to Redact the Public Transcript and or the Public Broadcast of a Hearing Held on 25 and 26 June 2018","date":"19-02-2019","case":"Ayyash et al. (STL-11-01)","case_before":"Trial chamber","case_stage":"Trial","filing_party":"Trial Chamber","filing_number":"F3760","record_type":"Order","direction":"ltr","files":{"9694":"English"}},{"id":4164,"title":"Order to Redact the Public Transcript of Hearings Held on 21, 22, 25, 27, 28, and 29 January 2016","date":"19-02-2019","case":"Ayyash et al. (STL-11-01)","case_before":"Trial chamber","case_stage":"Trial","filing_party":"Trial Chamber","filing_number":"F3758","record_type":"Order","direction":"ltr","files":{"9692":"English"}},{"id":4165,"title":"Trial Chamber's Internal Memorandum to the Head of Defence Office - Monitoring the Effective Legal Representation of Mr Hassan Habib Merhi's Defence","date":"14-02-2019","case":"Ayyash et al. (STL-11-01)","case_before":"Trial chamber","case_stage":"Trial","filing_party":"Trial Chamber","filing_number":"F3759","record_type":"Internal Memorandum","direction":"ltr","files":{"9693":"English"}},{"id":4163,"title":"Public Redacted Version of 'Decision on Prosecution Application for a Summons to Appear for Witness PRH588 and Order Issuing a Summons' of 16 February 2017","date":"12-02-2019","case":"Ayyash et al. (STL-11-01)","case_before":"Trial chamber","case_stage":"Trial","filing_party":"Trial Chamber","filing_number":"F2995","record_type":"Decision","direction":"ltr","files":{"9687":"English","9688":"Annex A","9766":"\u0639\u0631\u0628\u064a","9767":"Annex A Arabic"}},

Ce fichier structuré peut être aisément converti avec OpenRefine par exemple au format csv ou xls.

En résumé…

Récupérer des données en deux clicks, vous avouerez que c’est rapide et pratique!

Comprendre le fonctionnement d’un site internet, la manière dont il affiche ses données, comment il interagit avec une base de données, est primordial lorsque l’on cherche à optimiser sa collecte d’information.

Nous reviendrons dans un prochain billet, à l’aide d’un exemple, sur d’autres aspects de l’outil Développement Web de Firefox…