Oito cores do arco-íris: sobre cores em termos de matemática

Por mais de cinco anos, publicamos artigos sobre vários tópicos de visão computacional em Habré. Na maioria das vezes, eles estão associados ao reconhecimento de documentos, porque estamos sempre ansiosos para compartilhar com você tudo que é interessante e novo que fizemos no Smart IDReader . Embora tentemos honestamente apresentar nosso conhecimento de forma "universal" para que você, nossos leitores da Habr, possa usá-los facilmente em seus projetos e startups. Hoje decidimos ir além e apresentar a uma ampla audiência um material matematicamente harmonioso fundamental sobre o tema da cor, delineado em palavras simples.

Definição de cores


A definição de Schrodinger pode ser considerada uma das definições de cor mais bem-sucedidas: a cor é uma propriedade comum da luz de composição espectral diferente para causar a mesma sensação visual. Importante nesta definição é o entendimento da cor não como uma propriedade absoluta da luz, mas como um fenômeno que depende do observador: se dois raios de luz causam ao observador as mesmas sensações, a cor é a mesma e, caso contrário, é diferente.

No entanto, essa definição não pode ser chamada de completamente bem-sucedida. Afinal, ele pode ser usado apenas em condições colorimétricas, ou seja, especialmente projetadas para que uma pessoa possa atuar como um dispositivo de medição. Por exemplo, você olha para a ocular e seus olhos são uniformemente iluminados com a luz de alguma composição espectral. Nas situações mais difíceis, por exemplo, quando você apenas olha em volta e vê uma camisa vermelha ou um prado verde, acontece que não é possível simplesmente estudar as sensações do observador e construir com base nessa teoria de cores.

Sabemos pelo curso da física, graças a Newton, que na luz branca há um arco-íris. Manifesta-se pela dispersão da refração da luz em um prisma ou suspensão, que ocorre no ar durante a chuva de cogumelos. Isso acontece da seguinte maneira: um prisma direciona luz de diferentes comprimentos de onda em diferentes direções, e vemos radiação quase monocromática (isto é, um único comprimento de onda) em cada direção. Seguindo diferentes direções, vemos luz de diferentes comprimentos de onda, o que nos faz sentir como uma transição do violeta para o azul, amarelo e depois para o vermelho. Cada uma das cores do arco-íris corresponde diretamente a um comprimento de onda específico, mas isso não significa que os comprimentos de onda individuais possam ser atribuídos a todas as cores em geral.

Como o sensor funciona


Como a cor depende da percepção do observador, vamos descobrir o que é um sensor.. Um sensor é o órgão que fornece ao observador informações visuais abrangentes. Para humanos, esse é o olho e, para o robô, uma câmera RGB. O sensor de cores é caracterizado por um conjunto de elementos fotossensíveis de vários tipos. No olho, em condições de luz intensa, três tipos de cones são ativos: "azul", "vermelho" e "verde", cada um com sua própria sensibilidade espectral. A sensibilidade espectral é uma função da magnitude da resposta a um quantum, ou seja, a uma porção de luz de um determinado comprimento de onda. Por exemplo, o cone "azul" é mais sensível aos comprimentos de onda na região de 450 nanômetros. Podemos supor que quando a radiação de qualquer espectro cai sobre uma pequena área da retina, há três sinais dessa área da retina, três valores não negativos que mostram o quanto os "azuis" estavam excitados nessa área, em médiaCones “vermelhos” e “verdes”. Assim, a retina humana ou a matriz fotossensível da câmera projeta o sinal espectral em três dimensões.espaço de cores o, as coordenadas indicadasR, Ge B. A origem ("zero") será a ausência de radiação - uma situação em que nenhum dos três tipos de receptores é excitado.

Cor


A distância de zero no espaço de cores é chamada brilho , essa é uma característica de energia. Se pegarmos uma fonte de luz e aumentarmos sua potência, o ponto correspondente no espaço de cores RGB se afastará do zero em uma linha reta através da origem. A diagonal principal, ou seja, os valores de triplos nos quais os componentes de cor são iguais(R=G=B)- é um eixo acromático , com cores cinza.

Para uma análise mais aprofundada, removeremos o brilho da cor. Para fazer isso, projete centralmente (com o centro da projeção em zero) todo o espaço de cores em qualquer plano que não passe pelo zero. Todos os pontos no espaço de cores que diferem apenas no brilho são projetados no mesmo ponto no plano. Nós entraremos em um avião chroma , e um par de coordenadas neste plano será chamado chroma , ou seja, que parte da cor que não está relacionado com o poder de radiação.

Quantas cores existem no arco-íris?


Vamos agora considerar todos os tipos de cores percebidas pelo olho humano e nos perguntar: como será esse conjunto se o projetarmos no plano de cores?

Para fazer isso, primeiro percorra todos os comprimentos de onda do espectro visível (de 380 a 700 nanômetros) e aplique os pontos correspondentes ( cores espectrais puras ) no plano de cores. Temos uma curva curva (veja a figura no início do artigo), chamada de locus espectral .

Será interessante para os matemáticos observar que no espaço RGB o locus espectral é uma curva em forma de gota fechada com uma única torção na origem, que, quando projetada centralmente com um centro na mesma origem, se transforma em uma curva aberta no plano de cores.

Como o sensor fornece uma projeção linear de todos os tipos de espectros na faixa visível no espaço de cores, qualquer combinação possível (R, G, B) pode ser obtida como uma combinação convexa ("mistura") daquelas reações geradas por cores puras. Isso também se aplica às projeções no plano de cores. Assim, as cores localizadas no casco convexo do locus espectral são fisicamente viáveis . E, como o locus espectral de uma pessoa não possui concavidades, é complementado por um casco convexo com um único segmento conectando suas extremidades. A figura resultante é chamada de triângulo colorido.embora, como vimos, o ângulo desse "triângulo" seja na verdade apenas dois e, em vez do terceiro, haja um arredondamento na região de 520 nanômetros. Portanto, as cores de todas as cores visíveis para uma pessoa formam um triângulo de cores - uma figura curvilínea convexa com dois vértices.

Agora, consideramos o ponto de interseção do eixo acromático no espaço RGB com o plano de cores. Este ponto será chamado neutro e corresponderá ao branco. Cada direção do ponto neutro até a borda do triângulo de cores define o tom da cor . A cor de um ponto na borda é chamada de cor saturada de um determinado tom, e todos os pontos entre neutro e saturado podem ser obtidos como uma mistura dessa cor saturada com branco em diferentes proporções.

Como pode ser visto na figura, a maioria das cores saturadas são cores espectrais puras, ou seja, pontos do locus espectral correspondentes à radiação monocromática de diferentes cores do arco-íris de 380 a 700 nanômetros. No entanto, em um segmento de linha reta da borda do triângulo colorido de 700 a 380 nanômetros, vemos cores saturadas, que não correspondem a nenhuma cor pura do espectro. Essas são cores magenta chamadas não espectrais . As flores roxas não podem ser associadas a um único comprimento de onda, mas podem ser obtidas como uma resposta do sensor a uma mistura de ondas vermelhas e violetas.

É possível ver a cor roxa no arco-íris? Já descobrimos que em um único arco-íris não é. Mas, às vezes, no céu, podem ser vistos arco-íris duplos de várias naturezas. Entre eles está um arco-íris refletido acima da superfície da água com sol muito baixo. Nesse arco-íris, depois que a cor violeta fica novamente vermelha, laranja e assim por diante. E na junção de vermelho e roxo, você pode ver a mistura deles - roxo. Acontece que pode haver oito cores no arco-íris refletido!

Como ver cores inexistentes


Para aqueles que seguiram de perto o raciocínio, pode surgir a pergunta: e a parte do plano de cores que está fora do triângulo de cores? Esses pontos podem até ter coordenadas bastante positivas.(R,G,B). Essas são as cores? Uma pessoa pode ver uma cor que não é causada por qualquer radiação espectral caindo em seus olhos? Difícil dizer, mas talvez sim. Por exemplo, quando um tijolo cai sobre sua cabeça e “pássaros” e “estrelas” aparecem, é provável que algumas das cores que ele vê sejam fisicamente inatingíveis. Isso ocorre porque, no momento da ação mecânica dos neurônios do cérebro, os sinais neles são de natureza bastante aleatória e, ao mesmo tempo, pode ocorrer uma combinação de sinais que nunca surge como resultado do efeito da radiação no olho humano. Da mesma forma, podemos assumir que uma pessoa pode ver cores inexistentes em um sonho.

Observador padrão


Como observado acima, o espaço de cores depende do observador. Se os sensores de dois observadores derem respostas diferentes à radiação do mesmo espectro, os espaços de cores que eles construíram (e também os triângulos de cores) serão diferentes. Portanto, para experimentos numéricos, um observador padrão foi registrado , cujas curvas de sensibilidade dos receptores são consideradas modeladoras da bioquímica e da percepção humana.

Além disso, para um observador padrão, as curvas de sensibilidade são normalizadas para que, se todos os três tipos de elementos fotossensíveis sejam excitados por uma fonte que tenha o mesmo brilho espectral para cada um dos comprimentos de onda,R, Ge BAs reações do sensor serão iguais entre si. Isso significa que a luz do dia branca (que contém apenas todos os comprimentos de onda com aproximadamente o mesmo brilho espectral) cai no eixo acromático do espaço de cores.

O que toda garota sabe


Consequências importantes do fato de a percepção de cores de uma pessoa ser tridimensional e o mundo espectral ser de dimensão infinita são o metamerismo da radiação e o metamerismo das cores .

Considere duas luzes brancas diferentes - luz do dia e fluorescente. Ao contrário da luz do dia, o poder da luz luminescente não é distribuído por todo o espectro, mas está concentrado em várias seções estreitas. No entanto, essas áreas são selecionadas para que as respostas dos cones “azul”, “vermelho” e “verde” sejam iguais entre si, ou seja, para que o observador perceba a luz como branca.





Assim, vemos que lá e ali, o observador fixa uma cor branca, embora os espectros iniciais não tenham nada a ver com isso - isso é chamado de metamerismo. É o conceito de metamerismo que está oculto na definição de Schro dinger: fixando o sensor, fatoramos o espaço do espectro de tal maneira que alguns espectros começam a ser caracterizados pela mesma reação do sensor (e, consequentemente, dizemos que eles têm a mesma cor) e outros - diferente (dizemos que sua cor é diferente). No entanto, é possível distinguir “duas luzes brancas” - passando uma luz luminescente através de um prisma, veremos um arco-íris “rasgado”.

Milagres não param por aí. Pode haver duas cores (necessariamente com características espectrais diferentes) que, refletindo a luz do dia, levarão à mesma resposta do sensor e refletirão luminescentes a diferentes. Ou vice-versa. Ou seja, para as mesmas cores, o metamerismo ocorrerá sob uma luz, mas não em outra. E nisso não há psicologia, apenas matemática. E estamos falando de situações bastante da vida. Provavelmente toda garota sabe que não vale a pena pegar uma saia e blusa compradas separadamente sob luz fluorescente, na esperança de que elas se encaixem na natureza, embora ela não saiba o porquê.

Tudo isso já é um pouco confuso, mas ainda não alcançamos o pior.

Então, o que é cor?


A principal confusão é o que chamamos de cor três coisas diferentes.

Primeiro, chamamos de cor a sensação de colorir . Quando procuramos uma camisa em um armário escuro, dizemos "vejo uma camisa vermelha" e não "vejo uma camisa preta", embora, de fato, a radiação refletida pela camisa no escuro seja tão fraca que pareça mais preta. A cor vermelha neste caso é uma característica do corante aplicado ao tecido da camisa. Matematicamente, a cor pode ser especificada como uma característica espectral - uma função da refletividade, dependendo do comprimento de onda.

Em segundo lugar, a cor pode ser chamada de sensação de luz.criado por uma fonte de luz. Por exemplo, distinguimos quando uma pessoa tem uma tez verde e quando uma luz verde cai sobre seu rosto. A iluminação é determinada pela função espectral da intensidade da radiação, dependendo do comprimento de onda.

E terceiro, há cor no significado colorimétrico, ou seja, um sentimento da radiação que "voou" em nossos olhos. Como sempre observamos a luz refletida, essa é a radiação de uma fonte de luz refletida no objeto observado e, ao mesmo tempo, alterada. De acordo com as leis da física, sua função espectral é o produto das funções espectrais de iluminação e cor:

F(λ)=S(λ)Φ(λ),


Onde F(λ)- função espectral da radiação que entra no olho, S(λ)- função espectral da fonte de luz, Φ(λ)- característica espectral da cor do objeto.

Consistência da cor


Nos seres humanos, o mecanismo de constância da cor é conhecido - a capacidade do sistema visual de avaliar a cor sob diferentes condições de iluminação. Essa é uma habilidade evolutivamente importante: por exemplo, um macaco precisa saber se a fruta ficou vermelha ou se a luz do pôr do sol caiu sobre ele. Para resolver esse problema, o sistema visual humano, recebendo sinais ainda diferentes dos sensores, pode, no entanto, encontrar as duas cores iguais, mas diferentemente iluminadas. Este é um fenômeno de ordem superior ao metamerismo. Pertence ao campo de maior atividade nervosa e ainda não é suficientemente estudado.

Como dissemos, podemos assumir que, de cada ponto do campo de visão, 3 números entram no cérebro - as reações dos receptores de cone "azul", "vermelho" e "verde". Seus valores são especificados como uma integral ao longo do comprimento de onda:

c=0F(λ)χ(λ)dλ=0S(λ)Φ(λ)χ(λ)dλ,



Onde c- vetor de resposta do sensor (R,G,B), χ(λ)- a função vetorial da sensibilidade dos "cones" de três tipos.

O cálculo dessa integral ocorre fisicamente quando a luz é refletida no objeto e, depois, eletroquimicamente quando a luz provoca uma resposta dos receptores da retina, como resultado dos quais três números caracterizando a cor são formados.

Para determinar a cor de um objeto, o sistema visual humano resolve o problema inverso: para cada ponto da imagem, a partir desses três números e, possivelmente, conhecido pelo sistema de características próprias, são extraídas informações sobre as distribuições espectrais de refletividade e brilho da iluminação.

Essas duas funções estão incluídas na integral como um produto, portanto, a tarefa de determiná-las parece uma zombaria. No entanto, pode-se argumentar que a consistência das cores em uma pessoa funciona. O desenvolvimento de algoritmos de constância de cores para visão técnica é uma tarefa científica urgente.

Onde aplicar esse conhecimento?


Na Smart Engines, temos sérios conhecimentos, não apenas no reconhecimento e autenticação de documentos . Participamos constantemente de projetos personalizados em vários tópicos da visão computacional . Assim, a teoria das cores descrita no artigo foi aplicada na região dos raios X para classificar o minério de diamante na Yakutia. A radiação que passa através da rocha foi registrada por dois detectores sensíveis a diferentes faixas de comprimento de onda. Verificou-se que todos os diamantes têm a mesma cor, diferente da cor do minério vazio. Essa "mancha" facilitou a identificação de diamantes indistinguíveis do minério de outras maneiras.

, ..-.., « » ..-.. .

All Articles