Yeux, cerveau, qualité vidéo: réflexions sur 120fps, 8K, HDR, baguettes, cônes et «effet feuilleton»

J'ai beaucoup écrit dans ce blog sur la fidélité de la reproduction sonore, et la vidéo a été injustement contournée et touchée seulement indirectement. J'ai décidé de corriger la situation - l'article est entièrement consacré aux problèmes de qualité d'image, de haute fidélité de lecture vidéo, ainsi qu'à leur relation avec la vision humaine.



En tant que fidélité irréprochable à la lecture vidéo, on peut prendre un tel niveau technologique auquel l'image sur le moniteur ne peut pas être distinguée de la réalité environnante. On sait qu'à l'heure actuelle, ni les téléviseurs et les projecteurs traditionnels, ni les lunettes et les casques de réalité virtuelle ne sont capables de cela, mais les modèles et les directions dans lesquels il est logique de travailler sont déjà tracés. Sous la coupe, j'essaierai de déterminer les critères de qualité de reproduction les plus significatifs en fonction du fonctionnement de notre perception visuelle.

Neurophysiologie de la perception visuelle


Pour comprendre l'importance de tel ou tel critère, vous devez avoir une idée du fonctionnement de la vision et de la façon dont le cerveau reconnaît et traite les signaux visuels. Sur la rétine humaine, il existe une zone extrêmement importante - la fosse centrale de la rétine. C'est cette zone, qui ne représente que 1% de la surface totale du capteur visuel, qui est capable de voir et de transmettre des images haute définition et détaillées (c'est-à-dire qu'elle dispose d'un nombre suffisant de récepteurs visuels: bâtonnets et cônes). De plus, les informations provenant de ce site chargent plus de la moitié des neurones de la zone visuelle du cortex cérébral au travail.



Dans le même temps, la fosse visuelle ne peut couvrir que 2 degrés du champ visuel. Une image visuelle à plus grande échelle du monde environnant est créée dans la zone visuelle du cortex grâce à des sections d'informations «scannées» séparées, ainsi que grâce au système de mémoire visuelle. Le processus de «balayage» visuel est rapide, mais prend encore un certain temps. Pour le moment, il n'y a pas de consensus sur la différence sur quelle résolution l'œil humain n'est pas en mesure de déterminer.

Le traitement des informations visuelles par le cerveau est rapide et invisible pour nous, mais c'est cette vitesse élevée de perception et de traitement qui nous permet de remarquer clairement la différence entre les différentes fréquences d'images et un certain nombre d'autres caractéristiques qui signalent au cerveau que l'image d'un tilleul n'est pas réelle. Dans le même temps, nous pouvons dire que toute l'image de la réalité que nous voyons est le produit d'une activité cérébrale régulière, quelque peu en retard dans le temps (en millisecondes) par rapport aux événements qui se produisent en ce moment. On peut donc affirmer que nos yeux vivent dans un passé très récent.



Un aspect important est la fréquence d'images. L'illusion d'un mouvement continu apparaît déjà à une fréquence de 13 à 17 images par seconde. Il est également connu que la vision humaine est capable de capturer à l'écran des objets qui apparaissent pendant une fraction de seconde (de 1/16 à 1/220 secondes). Cette capacité est individuelle et particulièrement bien développée chez les e-sportifs et les ingénieurs vidéo. Selon le professeur Stuart Enstos, le cerveau est capable de réduire le "retard" de la perception visuelle à 10-15 millisecondes.

Les tiges ne sont pratiquement pas sensibles aux fleurs et les cônes sont plus lents que les tiges. En gros, on peut dire que le "FPS maximum" en vision humaine est possédé par des bâtons. Au centre de la rétine, les bâtonnets et les cônes sont concentrés, ce qui vous permet d'obtenir une image à part entière, tandis que les cônes «lents» forment un plus grand degré de perception des couleurs, et les bâtonnets enregistrent principalement les mouvements.

L'inertie des récepteurs de la rétine (bâtonnets et cônes) est considérée comme la principale limitation physique de la vitesse de perception visuelle; ils déterminent principalement le délai de transmission des informations de l'œil au cerveau. Le Massachusetts Technological Institute a mesuré l'inertie minimale des photorécepteurs pour la transmission d'informations visuelles - elle était de 13 ms (ce qui correspond à 77 fps), confirmant les données d'Enstos. On sait également que l'inertie minimale "cône baguette" est de 20 ms (ce qui correspond à 50 fps). En termes simples, la limitation physiologique de la vitesse de perception visuelle est de 77 images par seconde et la perception des couleurs est de 50 images par seconde.

Cependant, il existe des observations empiriques qui indiquent qu'une image de 50 ips et, par exemple, 96 ips diffère visuellement de l'intensité des couleurs et d'une évaluation subjective de la clarté de l'image. Cette différence justifie la création de films et autres contenus avec une fréquence supérieure à 77 fps.

Certains auteurs écrivent que le cerveau est équipé d'un certain algorithme qui traite les informations visuelles et les comparent même avec des algorithmes de traitement par caméra. En réalité, la comparaison n'est pas correcte et le concept de l'algorithme n'est applicable que lorsque l'on tire la rétine sur le globe. Notre cerveau, comme beaucoup le savent, je pense, est un système analogique, et des processus électrochimiques et biochimiques s'y produisent qui déterminent les résultats de son activité. On peut appeler cela un algorithme, mais ce sera très loin des algorithmes de traitement de données numériques.

Ainsi, les critères responsables de la fidélité de la reproduction sont directement liés à la façon dont nous recevons les informations visuelles et à la façon dont le cerveau les perçoit et les traite. Il sera juste de dire que le secret du réalisme réside dans le plan de création d'une telle illusion que le cerveau ne peut pas s'identifier comme une fausse image. Et il y a un gros problème, les données sur la vitesse de perception du réel et la formation d'une image visuelle fictive n'ont pas été suffisamment étudiées, peuvent varier largement individuellement. et dépendent de centaines de facteurs physiologiques. Pour cette raison, les normes d'images de haute qualité sont généralement déterminées empiriquement, par la méthode la plus précise de piquer scientifique.

Résolution


Souvent, les gens qui commencent tout juste à se plonger dans les problèmes de qualité d'image numérique, croient que son seul critère important est la résolution. En partie, nous pouvons être d'accord avec eux, car le détail de l'image en dépend principalement. Aujourd'hui, il y a débat sur la façon dont la vie a besoin de formats avec une résolution supérieure à FullHD. Il est clair que le réalisme de la vidéo ne peut pas être atteint sans haute résolution, bien que ce ne soit pas la seule condition pour une haute fidélité de reproduction.

Par expérience subjective, nous pouvons conclure que si vous regardez attentivement et faites attention aux détails, en particulier en ce qui concerne les projecteurs et les écrans de très grande taille, l'utilisation de la 4K est justifiée. De plus, aujourd'hui, la 4K se transforme en une sorte de standard pour les personnes qui se soucient de la qualité de l'image, disent-ils, avec une résolution inférieure, c'est même indécent à acheter. Les sociétés commerciales, y compris la nôtre, sont très satisfaites de ce stéréotype - cela nous permet de gagner plus.



Déjà aujourd'hui, de nombreux acheteurs considèrent le 8K comme un mal nécessaire. En règle générale, un tel désir ne découle pas du fait que la différence est vraiment perceptible pour l'acheteur. Souvent, ils veulent simplement acheter un appareil dont ils ne douteront pas, c'est-à-dire afin de savoir que le téléviseur ou projecteur acheté a été créé à la limite des capacités technologiques de son époque. La résolution acquiert une importance particulière dans les systèmes VR, où ils essaient de réaliser une immersion des utilisateurs et s'efforcent de créer l'illusion la plus fiable de la réalité.

Contrairement aux prévisions d'experts avisés mais peu avertis, la diffusion en 8K a déjà commencé. RED et NHK sont diffusés dans ce format, et peut-être quelqu'un d'autre que je ne connais pas, mais ils sont devenus des pionniers. Sur la base de recherches dans le domaine de la réalité virtuelle, certains prédisent l'avenir du 8K et écrivent que ce format a une grande valeur pratique. Je ne partage pas un optimisme aussi franc, même si je suis convaincu que tôt ou tard je pourrai trouver des différences par rapport au 4K et même que le 8K ne sera pas le dernier dans la course aux résolutions.



Ce n'est pas du fait que le 8K est vraiment nécessaire, mais à cet égard, les progrès ne devraient pas s'arrêter. La capacité technologique d'augmenter la résolution dépend de la taille réelle des pixels, il est logique que le dernier soit plus petit, plus la résolution est élevée. Je doute que les pixels puissent être réduits indéfiniment, tôt ou tard ce processus atteindra une limite physique.

Le problème de la haute résolution est le volume toujours croissant de vidéo et, par conséquent, la nécessité d'augmenter constamment la bande passante des canaux de données. En ce qui concerne la télévision et la diffusion régulière, des volumes colossaux de données haute résolution (même 4K) provoquent parfois des retards et des distorsions, ce qui est associé à un canal insuffisant pour la diffusion.

Plage dynamique


La capacité de notre vision à percevoir la lumière et les couleurs de différentes intensités, à distinguer un grand nombre de nuances a constitué un autre critère pour la qualité de l'image vidéo - la plage dynamique. Une fonction qui capture le rapport de la couleur la plus brillante à la moins brillante (mais pas encore noire) dans le contenu vidéo. La plage dynamique élevée et sa technologie actuelle sont appelées HDR. Il est généralement admis que l'œil humain est capable de déterminer la plage dynamique à l'intérieur de 1 000 000: 1, et parfois même plus. Cette capacité de vision est largement due à la nécessité de faire la distinction entre les dimensions et la forme des objets qui nous entourent, même avec un éclairage pas très bon.



Une expérience est connue qui reflète l'importance de la plage dynamique ainsi que la résolution. Ainsi, 1080p SDR et UHD HDR, puis 1080p HDR et UHD HDR, ont été comparés. Dans la première comparaison, la différence était perceptible à l'œil nu, mais pour le deuxième cas, elle n'était pas évidente. L'évaluation subjective était que l'utilisation du HDR est perçue comme une amélioration de la qualité (clarté, détail, précision) d'une image de 90% par rapport au SDR.

Fréquence d'images par seconde


Dans notre blog, nous avons abordé une fois la question de la fréquence d'images par seconde. Objectivement, la fréquence d'images élevée par seconde rend définitivement l'image plus réaliste. Ce que le premier film au monde tourné à 96 images par seconde, dont nous avons déjà parlé, l'a prouvé. De manière caractéristique, le film était documentaire. Ce n'est pas un hasard si ce sont précisément les fréquences qui sont plusieurs fois plus élevées que les 24 images par seconde traditionnelles pour le cinéma, qui sont utilisées dans le meilleur système de réalité virtuelle en série HTC vive pro. Comme je l'ai mentionné, c'est en VR qu'il y a un besoin urgent de l'image la plus réaliste.



Dossier documentaire, dont nous avons parlé, a été battu par le film américain "Long Way Billy Lynn dans la pause d'un match de football" d'Ang Lee, où la fréquence était déjà de 120 images par seconde. Malgré les percées dans le domaine de la fréquence, la plupart des gens sont accueillis avec indignation, blâmant l'effet du «feuilleton», de la «télévision», de la «basse cinématographie» et de la «malignité artistique» d'une telle fréquence. Comme, la mauvaise fréquence tue toute la «magie du tube chaud du film».

L'effet s'explique par le fait que la grande majorité des critiques identifie le bon cinéma avec ce qu'ils ont déjà vu, et ils ont vu du bon cinéma dans les salles de cinéma à 24 images par seconde. Dans le même temps, une augmentation de la fréquence de la majorité est associée aux séries télévisées, loin d'être toutes de bonne qualité. La norme est tellement enracinée dans la culture humaine qu'elle est garantie de se refléter dans la perception et devient l'un des critères de qualité, même si elle ne devrait pas l'être objectivement.

Total


Les composants logiques de la fidélité de reproduction, comme d'habitude, sont devenus des caractéristiques tout à fait compréhensibles, physiquement explicables, comme dans le cas du son. Dans ce cas, par analogie, il y a une demande d'archaïque (dans le cas du son, il y avait des lampes chaudes) et de vives critiques de la direction progressive du développement. Évidemment, les générations doivent passer avant le moment où un bon contenu cinématographique et vidéo est perçu non pas à travers le prisme du nombre d'images par seconde, mais selon d'autres critères. J'ai peut-être manqué certains des facteurs importants de fidélité de la reproduction. Faites-moi savoir dans les commentaires. J'apprécierais également vos idées personnelles sur ce que pourrait être la vidéo du futur.

Contenu photo utilisé:
www.quora.com/How-come-its-really-hard-to-look-directly-at-something-in-low-light-but-when-we-look-right-next-to-the-object-we-can-see-it-better
data.cyclowiki.org/images/9/90/Centralnaya-yamka-setchatki.jpg
www.provideomontaj.ru/tv-8k-chto-jeto-nuzhno-li-sejchas-pokupat-televizor-8k


, . , , .

All Articles