Georgy Potapov: «Je suis un consommateur professionnel de données OpenStreetMap»



— - , . GeoAlert, . OSM, — .

- Quand et comment avez-vous rencontré le projet OpenStreetMap?

- En 2009, lorsque j'ai lancé, avec mes collègues, une startup - la boutique en ligne Kosmosnimki, dans laquelle nous avons essayé de vendre des images satellites. Pour le site et un certain nombre de projets, nous avions besoin de cartes. En conséquence, le choix s'est porté sur OpenStreetMap.

Pourquoi sur lui? Tout d'abord, c'était un projet assez frais, dynamique et en développement, autour duquel quelque chose d'intéressant s'est toujours produit. De nombreux outils et technologies SIG bien connus sont apparus précisément dans les entrailles de ses communautés. Deuxièmement, à un moment donné, des gars qui participaient activement à l'OSM et qui en avaient une bonne compréhension ont travaillé avec nous.

- Vous cartographiez vous-même dans OSM?

"Non, mais je n'en avais pas fait autant avant." À des fins d'information, bien sûr, j'ai apporté quelques modifications à OSM. Par nature, je suis très paresseux, mon béguin n'a suffi qu'à dessiner quelques maisons. Je suis plutôt un consommateur de données OSM professionnel. À l'heure actuelle, chez GeoAlert, dans l'un des projets, nous réalisons des ensembles de données pour l'apprentissage automatique à partir d'eux, mais en même temps, je suis un consommateur de données responsable et reconnaissant.

Permettez-moi de vous rappeler qu'à un moment donné, Kosmosnimki a fourni gratuitement à OSM un certain nombre d'images satellites de la Russie et des pays voisins. Il me semble qu'alors il a aidé la communauté russe OSM, car il n'avait pas d'autre alternative de même qualité.

- Pourquoi avez-vous décidé de partager des images satellite avec OSM?

- Il y avait plusieurs raisons. Premièrement, nous avons nous-mêmes utilisé OSM dans notre travail et nous voulions qu'il soit plus précis et complet.

Deuxièmement, nous avons reçu un grand nombre de demandes de divers utilisateurs avec des demandes de partage d'images satellite, y compris de la communauté OSM. Au début, de telles lettres nous semblaient présomptueuses, mais nous nous sommes ensuite rendu compte que des volontaires nous écrivaient, qui dessinent une carte gratuitement et ne font pas d’argent dessus.

Le troisième est prosaïque. Vous devez comprendre que Kosmosnimki était encore pour nous un projet d'entreprise, c'est-à-dire que nous voulions gagner sur la vente d'images satellite. Aussi triste que cela puisse paraître, nous avons partagé avec OSM ce que nous ne pouvions pas vendre - des images avec une résolution de 6 mètres par pixel. Maintenant, cela semble ridicule, mais seule l'image satellite Landsat était disponible pour le rendu à l'OSM, dont la qualité était plus de deux fois pire - 15 mètres par pixel.

- C'était quoi OSM alors? Comment est-il maintenant?

- Comme je l'ai dit, il y a dix ans, OSM a établi des tendances dans le monde de la géoinformatique et déterminé l'orientation du développement du marché des SIG, car tout ce qui est nouveau est apparu dans sa communauté. Cependant, je suppose que cela est également dû au fait qu'à l'époque, dans l'ensemble, le marché de la cartographie et de la navigation était en pleine croissance. Par conséquent, l'attention de nombreuses personnes était rivée à tout ce qui se passait dans le monde OSM.
Maintenant que ce marché s'est stabilisé, il n'y a plus d'explosions et de vagues violentes. Il me semble que des processus similaires se déroulent au sein même de l'OSM, qui a déjà cessé d'être un législateur technologique. L'initiative est passée à de grandes entreprises qui ont appris à gagner de l'argent dessus, comme Mapbox. Désormais, OSM est avant tout une base de données. Peut-être pour cela, tout a commencé.

- Comment évalueriez-vous cette base de données?

- Tout dépend de la situation spécifique et de votre tâche. Si vous recherchez une carte pour un petit projet ou, à l'inverse, un projet global ou étudiez un SIG, l'OSM est idéal pour cela, car il est gratuit. Si vous avez besoin d'une précision incroyable et que l'intégralité des données est critique, vous devriez vous tourner vers les fournisseurs payants. Dans OSM lui-même, bien sûr, il y a beaucoup d'informations différentes, mais elles ne se trouvent pas à la surface. Pour l'obtenir, vous devez bricoler: étudier les balises, lire la documentation - en un mot, passer du temps. De plus, les données OSM ne sont pas réparties également entre les territoires. Une ville peut être bien rendue et l'autre mal rendue.

- Pour autant que je sache, vous avez déjà préconisé que les autorités russes utilisent plus activement l'OSM dans leur travail. Pouvez-vous nous en dire plus à ce sujet?

- À plusieurs reprises, il a suggéré que le ministère des Urgences prête attention à l'OSM et à l'expérience de l'équipe humanitaire OSM (HOTOSM), qui est impliquée dans la cartographie de la situation lors des urgences. Malheureusement, aucun succès n'a été enregistré dans ce domaine.

- À quoi pensez-vous que cela est lié?

- Les autorités russes, en général, sont assez fermées et, par conséquent, toute proposition de coopération de la part des citoyens est perçue avec suspicion. Si nous parlons du ministère des urgences, ce n'est pas un service civil à la fin. Disons-le plutôt, ils gravitent autour des structures de pouvoir, et donc cette attitude est fermée. Nous avons essayé d'établir un contact avec eux, de partager des données et d'aider à gérer l'OSM, mais cela n'a pas trouvé la réponse appropriée. Bien qu'il soit connu que le ministère des Urgences, d'une manière ou d'une autre, utilise officieusement l'OSM dans son travail, car le SIG, qu'ils doivent utiliser par la loi, n'est pas de la meilleure qualité.

- Dans le monde de la cartographie, une nouvelle tendance est la reconnaissance automatique des objets dans les images satellites. Pourquoi est-il devenu si à la mode maintenant? Beaucoup ont commencé à le faire.

- Cela est devenu massif et populaire en raison de la disponibilité et du faible coût des ressources informatiques, ainsi que de l'émergence de nouvelles architectures de réseaux de neurones que la plupart des développeurs peuvent gérer. Soit dit en passant, comme je l'ai déjà dit, l'une des sources de données pour la formation de tels modèles de réseaux de neurones pour reconnaître des objets sur des données de télédétection est une carte - et juste OSM, qui à son tour est gratuit, est une telle source et accessible à absolument n'importe qui.

- À quel point ce processus est-il automatique maintenant? Ou avez-vous toujours besoin d'un homme?

- Jusqu'à présent, les technologies n'ont pas atteint un niveau tel qu'une bonne carte précise est immédiatement produite. Pourtant, tant qu'une personne est nécessaire, il est le dernier maillon de la chaîne de création de données - il prend la décision finale: l'objet est-il correctement reconnu ou non? Un schéma similaire, par exemple, a été mis en œuvre dans un projet pilote Facebook, qui a récemment développé son propre éditeur en ligne avec un réseau de neurones - RapiD . Mais même dans ce cas, lorsqu'il y a une étape de validation, cela permet déjà à plusieurs reprises d'accélérer le travail du cartographe. Cependant, le jour n'est pas si loin quand la machine est comparée en qualité avec une personne et même la dépasse dans le travail de routine. Après tout, elle ne peut pas être fatiguée ou distraite, contrairement à une personne.

L'été dernier, si vous vous en souvenez, une inondation s'est produite dans la région d'Irkoutsk. Notre société a rapidement généré des données pour cette région à l'aide d'images satellite récentes (elles sont disponibles gratuitement sur GitHub ). Pourquoi avons-nous fait ça? Ils voulaient aider le ministère des Situations d'urgence à établir une carte des catastrophes, car ils suggéraient qu'ils ne disposaient pas de telles données et, dans l'OSM, ce territoire était vide. Six mois plus tard, nous avons lancé un projet de numérisation de bâtiments dans toute la Russie, retraité la région d'Irkoutsk, comparé les résultats et confirmé l'amélioration de la qualité des algorithmes.

- Votre entreprise est-elle prête à partager des données automatiques avec OSM?

- Prêt, nous réfléchissons juste à la façon de le faire d'un point de vue juridique. Il est possible que pour OSM, nous produisions un ensemble de données distinct qui sera compatible avec sa licence. Jusqu'à présent, malheureusement, je ne peux pas révéler plus de détails. L'essentiel est que cela nous intéresse, car nous-mêmes utilisons activement OSM.



- Avant la nouvelle année, il y avait des nouvelles que vous aviez largement testé votre algorithme - vous avez reconnu des objets à partir d'images satellites en Russie. Pouvez-vous partager les résultats de ce travail?

- Notre réseau de neurones a trouvé 54,5 millions d'objets dans le pays, qu'il a classés comme un bâtiment. Dans le même temps, seulement 18 millions de bâtiments ont été contribués à l'OSM en Russie. Déjà, la différence est 3 fois. Il est possible qu'elle soit encore plus grande.

La situation est similaire aux USA. Microsoft Neural Networka découvert 125 millions de bâtiments alors qu'il y en avait 33 millions dans OSM. Par conséquent, ces réseaux de neurones ont un grand avenir en cartographie.


Le rapport entre le nombre de bâtiments reconnus par le réseau de neurones et ceux cartographiés dans OSM

- Comment prévoyez-vous d'utiliser les résultats de votre travail - Objets reconnus? Que peut-on faire avec eux, en plus de mettre sur une carte?

- Nous avons un projet ouvert sur GitHub, où nous téléchargeons progressivement les ensembles de données que nous avons générés automatiquement. Après avoir découvert l'objet, la tâche suivante est la validation et le remplissage, car peu de gens ont besoin des contours du bâtiment à notre époque. Nous le faisons également avec l'aide de diverses sources ouvertes, par exemple OSM et Housing and Utilities Reforms. S'il s'avère que l'objet que nous avons généré est contenu dans OSM, nous le remplaçons par des données OSM.

Nous prévoyons nous-mêmes de les utiliser pour créer une application qui peut être utile pour la planification et la gestion territoriale. En gros, il s'agira d'un tel service, à l'aide duquel il sera possible de retracer la dynamique de la construction à travers le pays ou une région spécifique sur plusieurs années, pour obtenir des statistiques plus complètes que dans les rapports officiels. Voici quelques exemples d'utilisation de ces données.

- Votre système classe-t-il en quelque sorte les objets reconnus? Ou ne donne que les contours du bâtiment?

- Jusqu'à présent, uniquement sous une forme simplifiée. Nous avons appris à séparer qualitativement les bâtiments résidentiels des bâtiments non résidentiels et à plusieurs étages des bâtiments privés. Le site a une démoversion dans laquelle chacun peut le vérifier lui-même en commençant le traitement sur le territoire qui l'intéresse. Mais maintenant que nous travaillons sur une classification plus détaillée par type de bâtiment et de post-traitement, nous espérons également que cette année nous ajouterons des algorithmes de détection et de classification du réseau routier. En outre, une série d'algorithmes pour reconnaître la végétation, principalement la forêt, mais jusqu'à présent la principale priorité est le développement.

- Que diriez-vous à d'autres entrepreneurs et titulaires de droits d'auteur en réponse à la question: «Pourquoi et pourquoi ouvrir vos données à OSM?»?

"Je ne peux que partager mon histoire personnelle." Malgré le fait que je sois engagé dans le développement de géo-services depuis de nombreuses années, je ne suis pas assez riche pour maintenir ma propre production cartographique ou acheter absolument toutes les données. Et dans notre ancienne entreprise, et dans l'actuelle, nous avons utilisé et continuons d'utiliser OSM comme base de données cartographiques. Par conséquent, il est important pour moi que cela se développe davantage. Aujourd'hui, même les grandes entreprises ont tourné leur attention vers OSM et tentent de participer à son sort, par exemple Facebook et Microsoft.

Si vous prenez des données d'OSM, réfléchissez à la façon de les améliorer. Pourquoi? Pour qu'il y ait de la concurrence, afin que le jour où vous avez besoin de données, vous puissiez les retirer librement d'OSM et les utiliser dans votre entreprise. Ceci est particulièrement important pour les petites entreprises indépendantes.

Si nous ne réalisons pas de projets d'information ouverts, nous perdrons alors des avantages concurrentiels très importants. Cela s'apparente à une peur de parler en public. Cette peur doit être surmontée à un moment donné et commencer à diffuser quelque chose dans le domaine public. Et encore plus, cela doit être fait si vous ne voulez pas être victime d'une grande entreprise. J'aimerais que les petits acteurs indépendants restent sur notre marché.

- Pourquoi les grandes entreprises OSM?

- Je peux supposer que Facebook a atteint une certaine limite de saturation dans les pays développés et dans les pays en développement, afin de formuler correctement une stratégie de promotion, il lui manque diverses données de base, y compris des données spatiales, il les prend donc d'où elles sont - d'OSM . Pourquoi ne font-ils pas leur propre carte, comme Apple ou Google? Je ne sais pas. Mais bien que cette voie alternative semble noble - ils prennent non seulement des données, mais contribuent également à l'OSM. Soit dit en passant, ils ne sont pas les seuls à le faire. De plus en plus d'entreprises sont conscientes et finissent par partager des données avec OSM.

- Que dites-vous à la fin de la conversation?

- OSM est un énorme projet à but non lucratif qui combine de nombreux domaines différents, à la fois technologiques et sociaux. Et pour moi, c'est l'un des projets où j'ai l'impression de faire partie de l'histoire et de la communauté. Même la plus petite partie de celui-ci. Mais ce sentiment persiste longtemps. De plus, ce projet m'a fait découvrir de nombreuses personnes avec qui je communique encore, mais aussi me fais des amis. De telles émotions et connexions humaines ne peuvent donner qu'un projet open source. Par conséquent, non seulement Facebook, comme il le prétend, relie les gens, mais aussi ces projets créatifs ouverts dans lesquels les gens créent quelque chose ensemble. C'est un autre argument en faveur du fait qu'il vaut la peine d'investir dans de tels projets.



La communication des participants russes à OpenStreetMap se fait dans la salle de chat Telegram et sur le forum .
Il existe également des groupes sur les réseaux sociaux VKontakte , Facebook , mais ils publient principalement des actualités.

Rejoignez OSM!



Interviews précédentes: Vladimir Marshinin , Evgeny Usvitsky , wowik , SviMik , Kirill Bondarenko , Artem Svetlov , Sergey Sinitsyn , Natalya Kozlovskaya , Victor Vyalichkin , Ivan alias BANO.notIT , Anton Belichkov , Elena Balashova , Ilya Zverev , Timofey Subbotin , Sergey Golubev .

Source: https://habr.com/ru/post/undefined/


All Articles