Ojos, cerebro, calidad de video: reflexiones en 120 fps, 8K, HDR, varitas, conos y el "efecto de telenovela"

Escribí mucho en este blog sobre la fidelidad de la reproducción de sonido, y el video fue ignorado injustamente y tocado solo indirectamente. Decidí arreglar la situación: el artículo está completamente dedicado a los problemas de calidad de imagen, alta fidelidad de reproducción de video, así como su conexión con la visión humana.



Como una fidelidad impecable a la reproducción de video, se puede tomar un nivel tecnológico en el que la imagen en el monitor no se puede distinguir de la realidad circundante. Se sabe que en este momento ni los televisores y proyectores tradicionales, ni las gafas y los cascos de la realidad virtual son capaces de esto, pero los patrones y direcciones en los que tiene sentido trabajar ya se están rastreando. Debajo del corte, trataré de determinar los criterios más significativos para la calidad de reproducción de acuerdo con la forma en que funciona nuestra percepción visual.

Neurofisiología de la percepción visual.


Para comprender cuán significativo es este o aquel criterio, debe tener una idea de cómo funciona la visión y cómo el cerebro reconoce y procesa las señales visuales. En la retina humana hay un área extremadamente importante: la fosa central de la retina. Es esta área, que representa solo el 1% del área total del sensor visual, la que puede ver y transmitir imágenes detalladas y de alta definición (es decir, tiene una cantidad suficiente de receptores visuales: bastones y conos). Además, la información proveniente de este sitio carga más de la mitad de las neuronas de la zona visual de la corteza cerebral con trabajo.



Al mismo tiempo, la fosa visual puede cubrir solo 2 grados del campo visual. Se crea una imagen visual a gran escala del mundo circundante en la zona visual de la corteza debido a secciones separadas de información "escaneada", así como gracias al sistema de memoria visual. El proceso de "escaneo" visual es rápido, pero todavía lleva algún tiempo. Por el momento, no hay consenso sobre la diferencia sobre qué resolución no puede determinar el ojo humano.

El procesamiento de la información visual por parte del cerebro es rápido e invisible para nosotros, pero es esta alta velocidad de percepción y procesamiento lo que nos permite notar claramente la diferencia entre las diferentes velocidades de cuadros y una serie de otras características que le indican al cerebro que la imagen de un tilo no es realidad. Al mismo tiempo, podemos decir que toda la imagen de la realidad que vemos es producto de la actividad cerebral regular, algo retrasada en el tiempo (por milisegundos) de los eventos que están sucediendo en este momento. Por lo tanto, se puede argumentar que nuestros ojos viven en el pasado muy reciente.



Un aspecto importante es la velocidad de fotogramas. La ilusión de movimiento continuo surge ya a una frecuencia de 13-17 cuadros por segundo. También se sabe que la visión humana es capaz de capturar objetos en la pantalla que aparecen por una fracción de segundo (de 1/16 a 1/220 segundos). Esta habilidad es individual y especialmente bien desarrollada entre los deportistas electrónicos y los ingenieros de video. Según el profesor Stuart Enstos, el cerebro puede reducir el "retraso" en la percepción visual a 10-15 milisegundos.

Las varillas prácticamente no son susceptibles a las flores, y los conos son más lentos que las varillas. Aproximadamente, podemos decir que el "FPS máximo" en la visión humana está poseído por palos. En el centro de la retina, ambos bastones y conos están concentrados, lo que le permite obtener una imagen completa, mientras que los conos "lentos" forman un mayor grado de percepción del color, y los bastones registran principalmente el movimiento.

La inercia de los receptores de retina (bastones y conos) se considera la principal limitación física de la velocidad de la percepción visual; principalmente determinan el retraso de tiempo al transmitir información del ojo al cerebro. El Instituto Tecnológico de Massachusetts midió la inercia mínima de los fotorreceptores para transmitir información visual: fue de 13 ms (que corresponde a 77 fps), confirmando los datos de Enstos. También se sabe que la inercia mínima de "cono de varita" es de 20 ms (que corresponde a 50 fps). En pocas palabras, la limitación fisiológica de la velocidad de la percepción visual es de 77 fps, y la percepción del color es de 50 fps.

Sin embargo, hay observaciones empíricas que indican que una imagen de 50 fps y, por ejemplo, 96 fps difiere visualmente en la intensidad del color y la evaluación subjetiva de la claridad de la imagen. Esta diferencia justifica la creación de películas y otros contenidos con una frecuencia superior a 77 fps.

Algunos autores escriben que el cerebro está equipado con cierto algoritmo que procesa información visual, e incluso lo compara con algoritmos de procesamiento de cámara. En realidad, la comparación no es correcta, y el concepto del algoritmo es aplicable solo cuando se tira de la retina al globo. Nuestro cerebro, como muchos saben, es un sistema análogo, y en él ocurren procesos electroquímicos y bioquímicos que determinan los resultados de su actividad. Esto puede llamarse un algoritmo, pero estará muy lejos de los algoritmos de procesamiento de datos digitales.

Por lo tanto, los criterios responsables de la fidelidad de la reproducción están directamente relacionados con la forma en que recibimos información visual y cómo el cerebro la percibe y procesa. Será justo decir que el secreto del realismo radica en el plano de crear tal ilusión que el cerebro no puede identificarse como una imagen falsa. Y hay un gran problema, los datos sobre la velocidad de percepción de lo real y la formación de una imagen visual ficticia no se comprenden bien, pueden variar individualmente dentro de un amplio rango. y dependen de cientos de factores fisiológicos. Por esta razón, las normas de imágenes de alta calidad generalmente se determinan empíricamente, mediante el método más preciso de búsqueda científica.

Resolución


A menudo, las personas que recién comienzan a profundizar en los problemas de calidad de imagen digital, creen que su único criterio importante es la resolución. En parte, podemos estar de acuerdo con ellos, ya que el detalle de la imagen depende principalmente de ello. Hoy, hay un debate sobre cuánto necesita la vida formatos con una resolución más alta que FullHD. Está claro que el realismo en video no se puede lograr sin una alta resolución, aunque no es la única condición para una alta fidelidad de reproducción.

Por experiencia subjetiva, podemos concluir que si observa de cerca y presta atención a los detalles, especialmente cuando se trata de proyectores y tamaños de pantalla realmente grandes, el uso de 4K está justificado. Además, hoy 4K se está convirtiendo en un tipo de estándar para las personas que se preocupan por la calidad de la imagen, dicen, con una resolución inferior a la de comprar. Las empresas comerciales, incluida la nuestra, están muy contentas con este estereotipo: esto nos permite ganar más.



Ya hoy, muchos compradores consideran que 8K es un mal necesario. Como regla, tal deseo no surge del hecho de que la diferencia es realmente notable para el comprador. A menudo solo quieren comprar un dispositivo que no dudarán, es decir para saber que el televisor o proyector adquirido fue creado al límite de las capacidades tecnológicas de su tiempo. La resolución adquiere un significado especial en los sistemas de realidad virtual, donde intentan lograr la inmersión del usuario y se esfuerzan por crear la ilusión más confiable de la realidad.

Contrariamente a las previsiones de expertos sanos, pero no muy astutos, la transmisión en 8K ya ha comenzado. RED y NHK se transmiten en este formato, y tal vez alguien más que no conozco, pero se han convertido en pioneros. Según la investigación en el campo de la realidad virtual, algunos predicen el futuro de 8K y escriben que este formato tiene un gran valor práctico. No comparto ese optimismo franco, aunque estoy convencido de que tarde o temprano puedo encontrar algunas diferencias con respecto a 4K e incluso que 8K no será el último en la carrera de resolución.



Esto no se debe al hecho de que 8K es realmente necesario, pero en relación con esto, el progreso no debe detenerse. La capacidad tecnológica para aumentar la resolución depende del tamaño de píxel real, es lógico que el último sea más pequeño, cuanto mayor sea la resolución. Dudo que los píxeles se puedan reducir indefinidamente, tarde o temprano este proceso alcanzará un límite físico.

El problema de la alta resolución es el volumen cada vez mayor de video y, en consecuencia, la necesidad de aumentar constantemente el ancho de banda de los canales de datos. Cuando se trata de la televisión y la transmisión regular, los volúmenes colosales de datos de alta resolución (incluso 4K) a veces causan retrasos y distorsiones, lo que se asocia con un canal insuficiente para la transmisión.

Gama dinámica


La capacidad de nuestra visión para percibir la luz y los colores de varias intensidades, para distinguir una gran cantidad de sombras formaron otro criterio para la calidad de la imagen de video: el rango dinámico. Una función que captura la proporción del color más brillante al menos brillante (pero aún no negro) en el contenido de video. El alto rango dinámico y la tecnología que proporciona hoy en día se llama HDR. En general, se acepta que el ojo humano puede determinar el rango dinámico dentro de 1,000,000: 1, y algunas veces incluso más. Esta capacidad de visión se debe en gran medida a la necesidad de distinguir entre las dimensiones y la forma de los objetos que nos rodean, incluso con una iluminación no muy buena.



Se conoce un experimento que refleja la importancia del rango dinámico junto con la resolución. Entonces, se compararon 1080p SDR y UHD HDR, y luego 1080p HDR y UHD HDR. En la primera comparación, la diferencia era notable a simple vista, pero para el segundo caso no era obvio. La evaluación subjetiva fue que el uso de HDR se percibe como una mejora en la calidad (claridad, detalle, precisión) de una imagen en un 90% en comparación con SDR.

Velocidad de fotogramas por segundo


En nuestro blog, una vez tocamos el tema de la velocidad de fotogramas por segundo. Objetivamente, la alta velocidad de cuadros por segundo definitivamente hace que la imagen sea más realista. Lo que demostró la primera película del mundo rodada a 96 fps, sobre la que ya escribimos. Característicamente, la película fue documental. No es casualidad que sean precisamente las frecuencias que son muchas veces más altas que las tradicionales de 24 fps para cine, las que se utilizan en el mejor sistema de realidad virtual en serie del mundo HTC vive pro. Como mencioné, es en la realidad virtual que existe una necesidad urgente de la imagen más realista.



Registro documental, sobre el que escribimos, fue golpeado por la película estadounidense "Long Way Billy Lynn en el Break of a Football Match" de Ang Lee, donde la frecuencia ya era de 120 fps. A pesar de los avances en el campo de la frecuencia, la mayoría de las personas se encuentran con innovaciones con indignación, culpando al efecto de "telenovela", "televisión", "baja cinematografía", "malignidad artística" de tal frecuencia. Como, la mala frecuencia mata toda la "magia de tubo caliente de la película".

El efecto se explica por el hecho de que la gran mayoría de los críticos identifican el buen cine con lo que ya han visto, y vieron un buen cine en salas de cine con 24 fps. Al mismo tiempo, un aumento en la frecuencia de la mayoría está asociado con las series de televisión, lejos de que todas fueran de buena calidad. El estándar está tan arraigado en la cultura humana que se garantiza que se reflejará en la percepción y se convertirá en uno de los criterios de calidad, aunque objetivamente no debería serlo.

Total


Los componentes lógicos de la fidelidad de la reproducción, como de costumbre, se convirtieron en características bastante comprensibles, físicamente explicables, como en el caso del sonido. En este caso, por analogía, hay una solicitud de arcaico (en el caso del sonido, había lámparas calientes) y una crítica aguda de la dirección progresiva del desarrollo. Obviamente, las generaciones deben pasar antes del momento en que el buen cine y otros contenidos de video no se perciban a través del prisma de la cantidad de fotogramas por segundo, sino de acuerdo con otros criterios. Quizás me perdí algunos de los factores significativos de fidelidad de la reproducción. Házmelo saber en los comentarios. También agradecería sus ideas personales sobre cuál podría ser el video del futuro.

Contenido de la foto utilizada:
www.quora.com/How-come-its-really-hard-to-look-directly-at-something-in-low-light-but-when-we-look-right-next-to-the-object-we-can-see-it-better
data.cyclowiki.org/images/9/90/Centralnaya-yamka-setchatki.jpg
www.provideomontaj.ru/tv-8k-chto-jeto-nuzhno-li-sejchas-pokupat-televizor-8k


, . , , .

All Articles