Romance express sur Linkedin

Romance express sur Linkedin

Quand le virus de l’OSINT vous gagne, des réflexes assez drôles se mettent en place, comme la nécessité impérieuse de vérifier qui sont donc ces personnes inconnues qui vous écrivent sur LinkedIn. Cela se corse quand on a passé la soirée au lancement d’un rapport auquel on a participé et qu’effectivement, on aurait potentiellement pu parler à une certaine Agnès….

Évidemment avant de se précipiter à répondre favorablement à cette innocente requête, il est préférable de cliquer sur son profil pour voir qu’il y a un truc pas net : ici, pas de photo (pourquoi pas, moi je n’en ai pas non plus…) et elle semble avoir laissé son doigt appuyé un peu trop longtemps sur le « i » de « serving ». Détail détail…

En recherchant son nom sur internet, on ne trouve pas grand chose à part des occurrences bizarres en espagnol : Agnes est un prénom en vogue en Espagne, et « precio » signifiant « prix« , Google a tendance à sur-représenter les boutiques en ligne.

La recherche sur Pipl ne vaut guère mieux….

Son email apparaît toutefois sur des sites de rencontre et plusieurs photos d’une même personne y sont associées. Mais l’email est aussi signalé comme arnaque. Alors qu’elle se présente sous le nom de Agnes Precio, on remarque vite qu’un autre nom y est également associé : Sergeant Angela Pace.

Angela Pace est en fait une vraie personne employée de l’Armée américaine dont on retrouve facilement les profils [ouverts] sur les réseaux sociaux. On peut voir qu’elle est en charge du recrutement des nouveaux talents de l’Armée américaine et fait la promotion de l’institution en ligne.

En creusant un peu, on voit qu’elle appartient au U.S. Army Recruiting Command et a été promue en Novembre 2017 au grade de Sergeant Major – équivalent de Sous-Officier dans l’Armée française. Ses photos ont donc été pillées et utilisées pour créer des faux profils sur internet sous différentes identités.

Depuis quelques années le personnel de l’Armée Américaine présent sur les réseaux sociaux est pris pour cible pour la création d’arnaques financières sur les sites de rencontres : les Romance Soldiers Scam…

Moralité : Verrouillez vos réseaux sociaux….

Travailler avec des leaks: le cas des emails leakés du chef de campagne du Président Ukrainien (2nd partie)

Travailler avec des leaks: le cas des emails leakés du chef de campagne du Président Ukrainien (2nd partie)

Dans la première partie de cet article, Lou vous expliquait comment travailler sur des leaks d’emails, en prenant pour exemple ceux du chef de campagne du Président Ukrainien. Cette fuite de données ne concernait que 167 emails, assez simple à analyser avec un simple éditeur de texte.

Toutefois, trouver un si petit nombre de mails est assez rare. Ainsi, dans la cas des « Macron Leaks » en 2017, ce ne sont pas moins de 21.000 mails, issus de plusieurs boites, qui avaient fuité, rendant une analyse manuelle assez complexe à mener dans un temps très court. Oui, explorer les mails à la main, surtout en si grande quantité, peut-être assez fastidieux.

Heureusement, il est possible d’automatiser un peu le processus d’analyse et utilisant quelques outils libres et gratuits.

Comment sont livrés les mails?

La première question à se poser est de savoir comment les mails sont leakés. S’agit-il d’un lot de fichiers EML (chaque mail livré un par un), d’une boite mbox?, d’un fichier pst (Outlook)?

Le plus simple à analyser est le plus souvent d’avoir un mail par fichier.

Pour le format pst – c’est de loin le format le plus pénible – on peut importer ce fichier dans Outlook, à condition de le posséder, puis exporter cette boite au format EML. Sous Linux, il existe une bibliothèque appelée libpst, capable de convertir du pst en eml.
Pour le format mbox, j’utilise souvent Thunderbird, associé au plugin importexporttools, qui permet d’importer et d’exporter les boites mail dans un peu tous les formats.

Thunderbir et importexporttools chez openfacto.fr
Liste des fonctionnalités d’ImportExportTools

Indexer les mails pour mieux les interroger

Les moteurs de recherches d’Outlook ou de Thunderbird sont assez pathétiques en terme de fonctionnalités. Faire de la recherche fine peut s’avérer très pénible. Lorsqu’on a récupéré des courriels en abondance, rien de tel qu’un bon outil d’indexation pour requêter précisément.

En fonction du besoin et du niveau de compétence dont vous disposez, mais également de l’investissement en temps et en argent que vous souhaitez y consacrer, il est possible de recommander trois outils :

1- Rapide à déployer, portable et puissant, fonctionnant sous Windows, Mac et Linux, DocFetcher reste un outil d’indexation incontournable. L’interface est austère mais efficace : vous créez un index de vos mails. Puis vous lancer vos requêtes à l’aide de la syntaxe de Lucène, le moteur d’indexation.

2- Un poil plus complexe à paramétrer, Overview-Project dispose des mêmes fonctionnalités de recherche fine mais permet également de tagguer des documents, de faire des liens entre eux.

3- La Rolls du moment, même si il est plus complexe, OpenSemanticSearch, est un outil d’indexation complet, permettant notamment de faire de la reconnaissance d’entité nommées (NER), et donc d’enrichir automatiquement vos documents en retrouvant par exemple des sociétés des personnes, des lieux, etc…

Enfin, on surveillera de près Datashare, développé ces temps-ci par l’ICIJ (coucou Pierre!), qui permettra de faire tout cela dans une interface sexy en diable.

Travailler sur les entêtes des mails

Les entêtes des emails (ou headers) recèlent une foule d’informations et ne sont pas forcément très étudiés.

Pour les analyser en masse, il va falloir les extraire et si possible automatiquement. Pour cela, il existe une bibliothèque python très intéressante : mailparser. Une fois installée sur votre machine, cette commande permet d’extraire les informations suivantes :

  • bcc
  • cc
  • date
  • delivered_to
  • from_
  • message_id
  • received
  • reply_to
  • subject
  • to

Pour l’exemple des mails ukrainiens, voici la commande utilisée sous bash/Linux :

for i in *.eml;do mailparser -f « $i » -r -b >> emails.csv;done

Ce qui signifie : « pour chaque mail au format .eml, récupère les entêtes (-h) et le corps du message (-b) et enregistre tout dans un unique fichier appelé emails.csv ».

Une fois ce fichier créé, il est possible d’utiliser OpenRefine, pour nettoyer et enrichir ce fichier et d’obtenir cette feuille de calcul :

  • extraction des expéditeurs et destinataires
  • extraction du sujet, et de l’adresse IP d’envoi du message
  • identification et géocodage des adresses IP

Il est possible de voir immédiatement les aberrations, ou les détails qui ne collent pas dans un jeu de données de ce type, comme par exemple ces deux mails qui sortent du champ habituel des mails reçus ou adressés par le titulaire.

Le renommage des colonnes en Source et Target peut vous sembler curieux mais il est en fait très utile pour importer rapidement les données dans Gephi.
Au cas présent, le rendu des échanges sous forme de graphe est peu parlant (faible nombre de mails, et d’interlocuteurs…).

Graphe et OSINT avec Gephi

Mais avec un jeu de données plus important, notamment bien horodaté, il est possible de faire des choses très visuelles comme cette petite animation des échanges entre plusieurs boites mail, par Alexandre Léchenet.

Pour conclure…

Il s’agit de quelques suggestions et de techniques pour analyser un jeu de données de type emails et lui donner rapidement du sens, en comprendre les enjeux…

Souvenez-vous toutefois qu’avec ce type de leaks, il convient d’être particulièrement prudent : les pièces jointes des mails peuvent être contaminées et il conviendra de prendre toutes les précautions nécessaires avant de commencer cette exploration (Machine virtuelle, antivirus, etc…).

Sortez couvert-e-s!

Travailler avec des leaks: le cas des emails leakés du chef de campagne du Président Ukrainien (1ère partie)

Travailler avec des leaks: le cas des emails leakés du chef de campagne du Président Ukrainien (1ère partie)

Un leak récent a été mise en ligne le 22 Mars 2019 sur un forum de hacking Cyber Guerilla, publiant ainsi les emails de Vitaly Kovalchuk, directeur de campagne du Président Poroshenko en Ukraine, en lice pour une réélection, à huit jours du scrutin.

Vitaly Kovalchuk

Le groupe responsable de la publication des leaks est liée à la publication des leaks sur l’organisation Integrity Initiative, spécialisée dans la lutte contre la désinformation. Cette opération de hacking a été présentée comme une opération du gouvernement russe par les media britanniques. L’attribution de cette leak Ukrainienne, exercice toujours périlleux, est en effet une donnée importante puisque la fuite de ces emails intervient à un moment politique clef du pays dans un contexte où l’utilisation des attaques cyber a été signalée plusieurs fois pendant la campagne électorale.

Capture d’écran du site de publication de la leak

Avec seulement une centaine d’emails datant du 6 au 21 Mars 2019, CyberGuerilla illustre la valeur de cette leak en mettant l’accent sur des échanges qui démontreraient l’utilisation de soutiens politiques occidentaux en faveur de la navigation libre ukrainienne de la Mer d’Azov dont l’accès est actuellement bloqué par la Russie comme argument politique de campagne pour la ré-élection du Président Ukrainien.

En réalité, il s’agit en fait d’un seul email datant du 20 Mars 2019.

Traduction en commencant par le bas de l’email :

Vitaliy Kovalchuk – Pavel Anatolyevich, bonjour! Vraiment hâte de savoir quels ont été les résultats de la prise de contact avec Maas [Heiko Maas Ministre des Affaires Etrangères d’Allemagne]. Nous y sommes très attachés.

Pavel Anatolyevich – Bonjour, leur position n’a pas changé. Maas nous parle franchement au sujet de la mer mais si je comprends bien, ils ne veulent tout simplement pas risque le pipeline Nord Stream et aller au conflit ouvert. Je pense que cette question reste en suspens jusqu’à la fin des élections, ils sont très prudents.

VK – Des sanctions sont nécessaires avant. Ou, au moins, que l’Allemagne, se soit prononcée [publiquement]. Nous devons construire sur quelque chose. Nous devrions peut-être demander l’aide de nos amis.

PA – C’est exclu. Il y aurait l’effet inverse. Maas était extrêmement agacé par
la pression des états après la dernière action. Maintenant, il a évidemment fait comprendre qu’il n’y aura pas de décisions embarrassantes de leur part.

Pavel Anatolyevich est présenté par les hackers comme un fonctionnaire important dans l’aparatus d’Etat, probablement un proche ou le ministre des Affaires Etrangères lui-même [Pavel Anatolyevich Klimkin]. Trois éléments dérangent: l’absence de nom de famille mentionné dans l’email pour identifier la personne et son rôle, la langue russe (rappelons que l’ukrainien est la langue officielle du pays, étonnant que tout soit en russe). Enfin, il est difficile d’attribuer réellement l’adresse email à Pavel Anatolyevich – – qui n’apparaît nulle part.

D’autres éléments étonnent dans le dossier. Trois emails sont écrits en anglais et sont adressés ou viennent de personnalités occidentales: Carl Bildt – ancien Premier Ministre Suédois – (expéditeur), George Kent du Département d’Etat Américain (expéditeur) et Graham Atkins de la société Atkins Thomsons (destinataire). Ces individus utilisent des adresses personnelles (gmx, mail.com et tutamail.com) dans le cadre de communication très officielle, assurant le soutien de la Suède et des USA au Président et à la démocratie ukrainienne ou faisant référence à un procès judiciaire (qui a bien eu lieu). Non seulement, l’utilisation de ces adresses mais aussi la structure de certaines tournures de phrase semblent peu crédibles.

Email de Carl Bildt utilisant gmx.com et la mention de « the entire democracy world » pour le moins étrange
Email de George Kent en charge du bureau Eurasie au Département d’Etat Américain
Un partner de la société Atkins Thomson avec une adresse tutamail….

Les adresses emails de Carl Bildt et George Kent peuvent être analysées rapidement:

  1. L’adresses IP de l’email de Carl Bildt est localisé en Suède. Pas étonnant car il est suédois. Sauf que le 15 Mars dans l’après midi, il est à Londres et s’envolera le soir pour le Brésil (seule l’hypothèse du VPN semble tenir…).

2. L’adresse IP de l’email de George Kent est localisée plus bizarrement en Espagne (service VPN du Département d’Etat américain?) et son adresse email backup pour le service mail.com est une adresse en givmail.com du service temporaire d’email de GetNada. C est étrange.

L’ensemble de ce faisceau d’indices nous permet de nous questionner à juste titre: s’agit-il de vrais emails? Est-ce que Carl Bildt et George Kent sont bien les auteurs des emails assurant le soutien de leur gouvernement respectif à la démocratie ukrainienne? Est-ce une tentative de manipulation orchestrée de l’information afin de distraire à quelques jours d’un scrutin électora?. Cette tactique de distraction s’inscrirait alors dans la stratégie des 4 D employée régulièrement dans les campagnes de désinformation (Dismiss, Distract, Distort, Dismay comme le dit Ben Nimmo.).

Travailler avec les leaks dans la recherche en sources ouvertes

Rencontre entre l’open-source et la communauté cyber, les leaks ou data breach (fuites de données) font partie intégrantes des sources disponibles en sources ouvertes. Consacrées initialement par Wikileaks avec la publication en ligne des câbles diplomatiques des ambassades américaines autour du monde et des Syrian Files, ces leaks permettent d’avoir accès à du matériel de première main dans la recherche d’un sujet particulier. Néanmoins, elles amènent à se poser certaines considérations éthiques puisqu’il s’agit de matériel volé et obtenu au travers d’opération de hacking par divers groupes.

Si on s’intéressera beaucoup aux emails, documents, photos de première main qui vont permettre d’appuyer un élément de recherche avec une preuve solide et originelle, il ne sera pas inutile non plus de s’intéresser aux identifiants et mot de passe collectés. Il ne s’agit surtout pas de chercher à utiliser ces informations pour se logguer à un compte (ce serait illégal!).
Mais ces informations peuvent permettre de retrouver d’autres alias, d’autres boites mails appartenant à de individus.

Alors quoi faire face à ces leaks?

Dans un premier temps, il faut être capable d’y accéder et de les ouvrir en toute sécurité car ces leaks peuvent être piégés. Certains nécessitent d’aller les chercher sur le réseau ToR, ce qui demande de configurer son ordinateur à cet effet [un bon guide ici]. Il est toujours plus prévoyant d’ouvrir les fichiers dans une machine virtuelle pour les examiner [un guide ici] – Oracle propose un logiciel gratuit à cet effet [ici].

Ensuite il semble nécessaire d’identifier le groupe derrière et de comprendre leurs motivations. Les attributions sont parfois très faciles mais parfois surgissent de groupes anonymes qu’il est difficile à appréhender. Un excellent article et thread a été partagé et écrit par The Grugq concernant l’utilisation par les services de renseignement russes d’avatars hacktivistes pour pousser des informations servant un agenda précis.

Finalement la dernière étape, l’une des plus dures quand on doit traiter des giga-octets de données, c’est de vérifier l’authenticité des documents. Il s’agit donc de maintenir un esprit critique à tout moment face à ce que l’on voit et lit.

Une plateforme qui regroupe toutes les leaks

Distributed Denial of Secrets [lien vers un site utilisant ToR] a été lancé en décembre 2018 comme un collectif pro-transparence dont le but est de faire circuler l’information. Le collectif suit deux critères pour publication: est- ce intéressant/important pour le public et peut-on déterminer aux premiers abords la véracité du contenu?

Naviguer l’opacité des sociétés au Moyen Orient

Naviguer l’opacité des sociétés au Moyen Orient

Récemment, les enquêtes menées par C4ADS sur le patrimoine d’individus politiquement exposés et/ou sous sanction et les Panama Papers par l’ICIJ sur un cabinet d’avocat Dubaïotte spécialisé dans le montage de sociétés ont démontré l’importance du Moyen-Orient en terme de traçage de biens/ sociétés et sa place dans certains cas de financements opaques ou illicites internationaux. Les sociétés au Moyen-Orient peuvent apparaître au cours d’une enquête car elles sont soit localisées dans des juridictions considérées comme à risque en terme de blanchiment d’argent/financement du terrorisme ou par le degré d’opacité qu’elles offrent dû aux conditions de création d’entités en local (pas d’impôts, rapidité et facilité à créer, zones franches, absence de déclaration d’information).

stand de change à Erbil. Billets de banque locaux.
Stand de change à Erbil, Kurdistan

Cependant, faire de la recherche en sources ouvertes sur ces sociétés s’avère assez difficile à cause du manque de transparence. Certaines juridictions gèrent les démarches administratives sur base papier et requièrent souvent une présence physique pour effectuer l’enregistrement ou demander des informations. La plupart du temps, il n’y a pas de base de données centralisées et numériques de l’information. Les documents sont souvent dans la langue locale, ce qui rajoute de la complexité. Enfin certains pays proposent des options on-shore/off-shore qui peuvent ajouter une dernière couche de secret au dossier.

Pourtant à un moment donné, un enquêteur va devoir identifier une société, le bénéficiaire ultime et des actionnaires que ce soit pour une simple recherche de conformité ou pour une recherche plus pointue sur le contournement de sanctions, le financement du terrorisme, la prolifération, le crime organisé ou le blanchiment d’argent.

Le but de ce petit guide est de donner quelques pistes non-exhaustives pour évaluer ce qui peut être trouvé en sources ouvertes, les trous dans la compréhension plus globale de la société cible, comment gérer ces trous et décider quand il est temps d’aller sur le terrain.

Comprendre le paysage des sociétés au Moyen-Orient

Pour commencer, il est utile de rappeler l’utilité et les objectifs de la recherche sur les sociétés:

  • Vérifier l’existence d’une entité légale établie dans un pays (et qu’il ne s’agit pas d’une adresse postale – d’un individu par exemple – utilisée pour facturation afin de cacher la vraie société bénéficiaire localisée dans un autre pays)
  • Vérifier l’adresse physique de la société
  • Identifier les individus ayant le contrôle légal, les bénéficiaires ultimes et les personnes clef prenant les décisions
  • Identifier les activités affichées de l’entité versus les activités dans les faits de la société cible.
  • Replacer l’entité cible dans un schéma plus large de structures utilisées pour faire circuler des flux financiers, obtenir des biens ou détenir des biens.

Il est donc fondamental de comprendre le paysage du type d’entités rencontrées dans la région et ce que cela veut dire pour la recherche. Ce paysage peut être mouvant car il dépend de la législation en vigueur.

Emirats Arabes Unis

Les EAU offrent deux schémas de création de sociétés sur place:

  • Entité (LLC) onshore: la société va être localisées dans les EAU et aura la structure actionnariale suivante: 51% actionnaire émirien (souvent dormant) et 49% actionnariat étranger (ceux qui sont en contrôle dans les faits). C’est le type de structures qui présente le plus d’informations disponibles.
  • Entité offshore: la société est localisée dans une zone franche et propose un actionnariat 100% étranger. Il n’y a peu ou pas d’information disponible en ligne et il est difficile d’identifier l’actionnariat. Les zones franches les plus populaires sont: DIFC, JAFZA, DMCC, DAFZ, DCC/TECOM, KIZAD, RAK, FFZ

Qatar

Le Qatar offre quatre caractéristiques intéressantes :

  • Actionnariat local (LLC): la plupart des sociétés ont la structure actionnariale suivante: 51% actionnaire qatari (souvent dormant) et 49% actionnariat étranger (ceux qui sont en contrôle dans les faits).
  • Il y a des Zones Franches en développement : Ras Bufontas et Um Alhoul
  • Qatar Financial Center est onshore mais fonctionne suivant ses propres règles et régime fiscal.
  • Enfin, historiquement, certaines entités étrangères ne sont pas enregistrée au Qatar mais ont créé un établissement permanent avec les autorités fiscales. Un autre business model est d’envoyer des employés sous visa de tourisme.

Oman

Le Sultanat d’Oman est plus simple avec une entité à responsabilité limitée (LLC) nécessitant un partenaire local omanais à hauteur de 30% dans l’actionnariat. En plus de cela, il y a quatre zones franches : Sohar Port, Salalah, Al Muzunah et Duqm avec un régime particulier propre à chacune permettant un actionnariat 100% étranger.

Arabie Saoudite

L’Arabie Saoudite offre plusieurs types de sociétés ainsi que la possibilité d’avoir des actionnaires 100% étrangers, mais aussi parfois quelques obligations d’actionnariat local. L’Arabie Saoudite a aussi mis en place des villes industrielles où sont regroupées la plupart des sociétés industrielles.

Kuwait

Le Kuwait fonctionne sur le même principe que les EAU pour les LLC (mais avec quelques changements récents de législation). La Kuwait Freetrade Zone a été stoppée et les licences ne sont pas renouvelées.

Bahrain

A part dans un cas très précis, il n’y a pas de restriction sur l’actionnariat étranger. Deux zones franches existent avec des conditions particulières: Bahrain International Investment Park et Bahrain Logistics Zone

Liban

Le Liban offre plusieurs types de sociétés et aucune limitation en termes d’actionnariat étranger. Les sociétés peuvent être offshore (SAL) avec un objet restreint : vente et d’autres activités en dehors du Liban.
Le port de Beyrouth et de Tripoli sont des zones franches.

Jordanie

La Jordanie permet la création de plusieurs sortes de sociétés avec quatre régimes possibles: régulier, civil, off-shore et non lucratif.
L’actionnariat 100% étranger est permis dans certain cas. Il y a quatre zones franches: Al-‘Aqaba, Al-Zarqa’, l’aéroport international de la Reine Alia et le long de la frontière syrienne.

Iran

Il y a plusieurs types de sociétés et régimes possibles en Iran. Sauf dans le cas où un étranger fait un investissement en Iran, la société devra a minima avoir un actionnariat iranien de 51%. Il existe un nombre important de zones franches où l’actionnariat 100% étranger est possible, résumé ici.

Irak

Plusieurs types de sociétés existent et l’actionnariat 100% étranger est possible.

Syrie

Il n ‘y a pas de restriction en Syrie sur l’actionnariat étranger pour tout type d’entité. Il y avait un nombre important de zones franches avant la guerre: une liste ici.

Turquie

Il n’y a pas de limitation d’actionnariat étranger et la Turquie a un certain nombre de zones franches: ici

Les registres du commerce et autre listes officielles

En première ligne de recherche, il est judicieux de se référer aux bases de données officielles des juridictions concernées pour cerner l’entité en question.

Liste non-exhaustive

EAUChambre de commerce de Dubai
Dubai International Financial Center
National Economic Register
DED Abu Dhabi
DED Dubai
Ajman
Sharjah
Chambre de commerce de Sharjah
FFZ
DED RAK
TECOM
QatarChambre de commerce
Qatar Financial Center
OmanGouvernement Oman
Zone Franche Sohar
Zone Franche Salalah
Arabie SaouditeChambre de commerce de Jeddah
Commission Royale de Yanbu & Jubail
Ministère du Commerce
BahrainRecherche de licence commerciale
Chambre de commerce
KuwaitChambre du commerce
Sociétés listées en bourse
LibanChambre du commerce
JordanieRegistre des marques et brevets
Chambre de commerce de Amman
IranLe portail des entités légales
Chambre de Téhéran
Chambre de commerce iranienne
Bourse de Téhéran
IrakBusiness directory
Chambre de commerce de Erbil
Chambre de commerce de Baghdad
TurquieGazette turque

Travailler autour des trous

Ces bases de données permettent de donner un premier faisceau d’indices concernant la société cible. Mais que faire quand la société est inexistante ou les informations vraiment limitées? Il s’agit d’essayer de travailler autour de la cible, en regardant divers éléments:

  • Activités de l’entreprise: certaines activités, suivant où elles sont pratiquées, donnent une première indication. Activités de ventes de pièces détachées à forte valeur ajoutée? Activités stratégiques comme l’aéronautique, le militaire, l’armement, les industries de pointe? Service de financement type hawala ou Western Union? Import/Export? Le type de biens vendus tombe-t-il sous la définition de biens à double usage?
  • Étude des éléments techniques liés à la société: email, site internet, numéro de téléphone en regardant des sites pipl.com, en cherchant les emails sur les moteurs de recherche, en regardant comment le site web est construit.
  • Géolocalisation de l’adresse: l’adresse ou les adresses trouvées correspondent-elles à des bureaux ou un immeuble d’habitation?
  • Présence sur les listes de sanctions, notamment celle de l’OFAC et dans des documents juridiques américains (plus rapides à établir une procédure violation de sanctions)
  • Existence de la société sur les bases de données commerciales habituelles type yellow pages, yelp, 2gis, etc pour confirmer une adresse physique
  • Présence à des salons, conférence suivant le secteur d’activité
  • Plateformes de e-commerce comme Alibaba, Trade India
  • Existence de la société sur une base de données payantes : une très bonne et pas chère pour le Moyen Orient: Cedar Rose ou 5index pour le Liban.
  • Mention dans des leaks: offshores leak et Panama papers
  • Présence sur les réseaux sociaux : recherche de la société et de ses employés sur les réseaux sociaux comme Linkedin, Bayt, Instagram, Facebook

Cette étape nécessite beaucoup d’observation afin d’identifier le moindre indice: photo à géolocaliser, domaine d’email différent du nom de la société et qui peut révéler une nouvelle société ou un ancien nom, profils Linkedin d’employés de la société cible qui présentent le même parcours dans d’autres sociétés dans un autre pays, signifiant peut-être un lien avec une nouvelle entité, etc.

Rassembler les éléments et analyser

La dernière étape est de mettre en musique l’ensemble des éléments récoltés pour comprendre le portrait de la société qui en ressort et décider s’il est nécessaire d’aller sur place pour poursuivre l’enquête.

Croiser des données sur OpenStreetMap avec Overpass-Turbo

Croiser des données sur OpenStreetMap avec Overpass-Turbo

Lorsque l’on cherche à géolocaliser une image, ou une vidéo sans grandes informations disponibles, il est parfois utile de se reposer sur les seuls éléments visibles à l’écran :

  • L’intersection d’un pont autoroutier avec une voie de chemin de fer.
  • Un angle de rue d’une ville allemande, avec une station du bus, une borne de taxi, une église et une pharmacie…
  • etc….

Dans ces cas précis, il pourrait être utile de pouvoir requêter une base cartographique sur le mode :

“Montre-moi sur la carte tous les lieux comprenant une église et une pharmacie dans un rayon de 50 mètres.”.

C’est là qu’un outil comme overpass-turbo.eu et une carte collaborative très détaillée prennent tout leur sens!


Overpass est une interface de requête pour Openstreetmap.

Il existe plusieurs tutoriels d’utilisation d’OverPass-Turbo sur le net, et le but de celui-ci n’est pas de tout montrer mais de vous présenter un exemple concret de ce qu’il est possible de lui faire faire!

A gauche de l’écran, on trouve la zone de requête. A droite se trouve la zone géographique où l’on souhaite requêter. La première des choses à faire est donc de définir notre zone de recherches, en zoomant au bon niveau de détails.

Cherchons par exemple toutes les églises situées dans un rayon de 50m d’une pharmacie à Rennes, en Bretagne. Tout d’abord, zoomons sur la ville.

overpass-turbo sur openfacto.fr-02-10T12-01-00.947Z

Voici le script qui va nous donner ces informations :

/*
This query will retrieve churches at max distance of 50m of a pharmacy in the area
*/
[out:json][timeout:25];

node({{bbox}})[amenity=pharmacy]->.pharmacy;
 (
   way(around.pharmacy:50)[amenity=place_of_worship];
   node(around.pharmacy:50)[amenity=place_of_worship];
 );
 (._;>;);
 out meta;

Détaillons un peu ce script :

Nous avons tout d’abord commenté un peu celui-ci pour le rendre plus lisible :

/*
This query will retrieve churches at max distance of 50m of a pharmacy in the area
*/

Ensuite nous avons explicité une sortie de type json (un format de données plat), et une limite de requête sur le serveur à 25s.

[out:json] [timeout:25];

La requête proprement dite vient ensuite :

node({{bbox}})[amenity=pharmacy]->.pharmacy;

{{bbox}} signifiant “dans la zone visible à droite”.

Par convention, une pharmacie est déclarée dans OpenStreetMap en tant que node (noeud), affublé d’une valeur spécifique amenity, correspondant à la chaîne de caractères ‘pharmacy’.

Nous allons donc chercher dans la zone à droite, tous les noeuds, dont la valeur amenity possède la chaîne « pharmacy.So we first look for every node in this area that as this specific value and insert them in a variable called ‘pharmacy’ :

->.pharmacy;

Puis nous cherchons une église.

(
   way(around.pharmacy:50)[amenity=place_of_worship];
   node(around.pharmacy:50)[amenity=place_of_worship];
 );

Une église a une valeur amenity avec la chaîne de caractères “place_of_worship”, mais peut également être un node ou une way (c’est plutôt rare…), dans OSM.

on précise ensuite la distance en mètres :

around.pharmacy:50

 (._;>;);
 out meta;

Les deux dernières lignes correspondent à l’intersection de ces critères.

Une fois le script entré, on appuie sur « execute »

Ce qui nous donne ce résultat :

OverPass-Turbo exemple sur OpenFacto.fr

Il ne s’agit là que d’un simple exemple de requête.

Et bien évidemment, cette requête sera d’autant plus efficace que votre zone de recherches sera détaillée. C’est pour cela qu’il est important d’aider le projet OpenStreetMap, mais aussi de participer et d’encourager la participation à ce projet.

Quelques ressources complémentaires sur ce langage de requêtes :

Ce tutoriel sur Github est aussi très pratique.

Amusez-vous bien !

P.S. : Plein de remerciements à Eric Pommereau pour son travail toujours inspirant.

P.P.S : ce billet est basé sur un billet initialement posté sur mon blog personnel.

Géolocalisation du Moyen-Orient – le guide

Géolocalisation du Moyen-Orient – le guide

Parce que le Moyen-Orient ca n’est pas que la guerre et cela reste très envoûtant, Capteurs Ouverts fait un quizz de géolocalisation tous les jeudis avec un double objectif: se faire l’oeil aux paysages de la région et prendre connaissance de plusieurs outils et techniques pour s’exercer à la géolocalisation.

Pourquoi faire de la géolocalisation d’images et de vidéo? Pour vérifier si des événements ont vraiment eu lieu (où et quand), pour solidifier un faisceau de preuves (la Cours Pénale Internationale a déjà publié un mandat d’arrêt sur base de vidéos de réseaux sociaux).

Attention – cette page sera mise à jour régulièrement avec les solutions.

Erbil, Kurdistan irakien, @36.1892907,44.009303

Pour commencer il faut identifier les éléments remarquables et uniques sur la photo: ici des portraits et des éléments architecturaux.

On peut donc chercher sur internet les portraits des dirigeants et le drapeau qui donnent le Kurdistan

Les dirigeants du Moyen Orient – cherchez l’erreur….

La localisation (Erbil et Citadelle) précise peut être identifiée de plusieurs façons 1) l’utilisation de la fonctionnalité image de google/ yandex / tinyeye et l’extension RevEye est bien pratique 2) En recherchant des mots clefs Kurdistan + carpets + shop

Les coordonnés gps approximatives s’obtiennent en utilisant la fonction street view de Google Map (Le petit bonhomme orange).

Beyrouth, Liban @33.9016932,35.4902109 

Suivant la méthodologie initiale, on isole les éléments remarquables de la photo: un paysage en bord de mer, la jetée et des immeubles sur la droite.

L’utilisation de reverse image permet d’obtenir des indices de localisation: Liban et Beyrouth.

L’observation de google map montre en effet un grand front de mer.

En utilisant Google Street View, l’intégralité du bord de mer est disponible et permet donc d’essayer de trouver les éléments de la photographie initiale.

Téhéran, Iran, @35.7761143,51.4134674

Sans déroger à la règle, il s’agit d’isoler dans un premier temps les éléments uniques de la photo: ici un paysage urbain avec de la végétation, des montagnes en fond, des éléments architecturaux, une dome bleu. Cette méthode de départ a deux avantages: elle permet de passer du temps à identifier des détails uniques et face à une image difficile offre une démarche systématique pour démarrer.

Dans ce cas, la tour étrange à gauche est l’élément unique de départ. Une recherche de liste des buildings les plus hauts au Moyen Orient nous donne la réponse. Il s’agit de la tour Milad à Téhéran.

Pour progresser à l’étape suivante, il s’agit de déterminer à partir de la Tour Milad le périmétre potentiel de couverture de l’espace jusqu’au point de vue du photographe. L’idée est de réduire le périmètre de recherche des autres éléments remarquables à quelques quartiers de Téhéran. Les deux cercles bleus permettent de délimiter la photo: les montagnes à droit et la tour à gauche. Les autres éléments architecturaux se trouvent donc entre ces deux points.

L’étape suivante est de trouver la localisation du building noir qui pourrait être au niveau des quartiers de Vanak, Saadat Abad. Le bâtiment étant grand sur la photo, cela veut dire qu’il est prêt du photographe et plutôt loin de la Tour Milad. Cela vaut le coup donc de survoler la carte en commencant par les quartiers au milieu du carré jaune et entre les deux lignes bleues.

On tombe donc sur le ministère de l’énergie aux coordonnées suivantes: @35.7734441,51.4068829. En zoomant sur les coordonnées, il est facile de voir autour un bâtiment, l’hôpital Rajaie qui correspond architecturalement à la photo initiale. Le photographe obtient une perspective où l’hôpital est positionnement devant le Ministère. On peut voir sur la photo initiale qu’il y a une rue entre le photographe et l’hôpital. En tracant donc une flèche, on obtient la Tour Mellat avec un degrès de confiance assez élevé.