Eckdaten

Das Internet der Dinge wird weiter wachsen. Kameras stehen im Mittelpunkt dieser Revolution und ermöglichen eine neue Kategorie von Geräten und Anwendungen.  Die Kamera in der Türklingel gibt visuell Aufschluss darüber, wer vor der Tür steht. Ein Bildgeber im Kühlschrank bietet Informationen in Echtzeit, welche Lebensmittel fehlen. Ein Bildsensor im Backofen hilft abzuschätzen, wann das Essen fertig ist. Fortschritte in der CMOS-Bildsensor-Technologie tragen zu diesem Wachstum bei. Dazu zählen hohe Leistungsfähigkeit bei schlechten Lichtverhältnissen, geringe Stromaufnahme und hervorragende Bildqualität.

Das Internet der Dinge wird weiter wachsen. Vom vernetzten Heim bis zum vernetzten Auto, das IoT verändert unser Leben grundlegend. Kameras stehen im Mittelpunkt dieser Revolution und ermöglichen eine neue Kategorie von Geräten und Anwendungen. Diese „Dinge“ mit integrierten Kameras fließen in unseren Tagesablauf mit ein: Die Kamera in der Türklingel gibt visuell Aufschluss darüber, wer vor der Tür steht. Ein Bildgeber im Kühlschrank bietet Informationen in Echtzeit, welche Lebensmittel fehlen und noch eingekauft werden müssen. Ein Bildsensor im Backofen hilft abzuschätzen, wann das Essen fertig ist. Fortschritte in der CMOS-Bildsensor-Technologie tragen zu diesem Wachstum bei. Dazu zählen eine hohe Leistungsfähigkeit bei schlechten Lichtverhältnissen, eine geringe Stromaufnahme und eine hervorragende Bildqualität. Bei der Wahl des geeigneten CMOS-Bildsensors für IoT-basierte Heimautomatisierungslösungen sind wesentliche Leistungsmerkmale zu beachten, wie beispielsweise Sichtfeld, Tiefenschärfe, Dynamikbereich und Auflösung.

Kernstück von IoT-Kameras sind CMOS-Bildsensoren.

Kernstück von IoT-Kameras sind CMOS-Bildsensoren. ON Semiconductor

Weitwinkel oder Teleobjektiv

Den Teil der Szene, der durch die Kamera bei einer bestimmten Position und Ausrichtung einsehbar ist, bezeichnet man als Sichtfeld (FOV: Field of View). Es wird über die Brennweite, dem Abstand vom Konvergenzpunkt zur Bildebene, bestimmt. Die Brennweite wiederum hängt von der Wellenlänge des Lichts ab, so ist beispielsweise die Brennweite von blauem Licht (450 nm) etwas kürzer als die von rotem Licht (620 nm). Objektive mit fester Brennweite sind Grundobjektive, während man solche mit variabler Brennweite als Zoomobjektive bezeichnet. Bei den Grundobjektiven gibt es Weitwinkel-Objektive mit kurzer Brennweite (14 bis 35 mm, 114 bis 64° FOV) und Teleobjektive mit langer Brennweite (85 bis >300 mm, 30 bis <1°  FOV), die entfernte Objekte größer erscheinen lassen.

Heimüberwachungskameras, die einen großen Anteil im IoT-Bereich einnehmen, verfügen in der Regel über ein Weitwinkel-Objektiv mit fester Brennweite. Mit einem Sichtfeld von beispielsweise 130° oder 147° decken Kameras für DIY-Anwendungen (Do-It-Yourself) einerseits einen weiten Bereich ab, um kritische Abweichungen im Szenenbild erfassen zu können. Andererseits werden solche Kameras so an der Wand montiert, dass sie sich außer Reichweite befinden, was eine längere Brennweite und ein kleineres Sichtfeld erfordert. Die Hersteller konzentrieren sich heute darauf, zahlreiche Analysefunktionen in diese Kameraprodukte zu integrieren. Um wichtige Sequenzen / Bewegungen zu erfassen und festzuhalten ist es notwendig, die optimale Abstimmung zwischen Sichtfeld und Brennweite zu finden.

Schärfe in der Tiefe

Die Tiefenschärfe (DOF: Depth of Field) ist ein weiterer entscheidender Aspekt bei der Wahl des optimalen Bildsensors für eine IoT-Anwendung. Sie repräsentiert den Abstand zwischen den nächsten und am weitesten entfernten Objekten, die in einem Bild akzeptabel scharf erscheinen. Die Tiefenschärfe wird dabei durch die drei Faktoren Blendenöffnung, Objektabstand und Brennweite des Objektivs bestimmt. Eine offenere Blende, das heißt eine kleinere Blendenzahl f, führt ebenso zu einer geringeren Tiefenschärfe wie ein kürzerer Fokusabstand. Das nahe liegende Objekt wird scharf abgebildet und dadurch hervorgehoben, während der Hintergrund unscharf bleibt. Bei einer bestimmten Blendenzahl f verringert sich die Tiefenschärfe bei der Vergrößerung – entweder durch Annähern der Kamera an das Objekt oder durch ein Objektiv mit größerer Brennweite. Eine geringere Vergrößerung erhöht dagegen die Tiefenschärfe.

Die Blendenöffnung bestimmt, wie viel Licht über das Objektiv eintreten kann. Eine größere Blende mit kleinerer f-Zahl, zum Beispiel f/1, erlaubt mehr Lichteinfall als eine engere Blende mit größerer f-Zahl, beispielsweise f/12. Bei gleicher Helligkeit erlaubt eine größere Blende schnellere Verschlusszeiten, was die Aufnahme sich schnell bewegender Objekte mit weniger Unschärfe ermöglicht. Mehr Licht bedeutet auch weniger Körnigkeit als bei schwachem Licht. Bei Heimüberwachungsanwendungen ist eine größere Blende mit einer kleineren f-Zahl (zum Beispiel f/1.8) die häufigste Option, da hier eine hervorragende Bildqualität vor allem in dunkleren Umgebungen entscheidend ist.

Der CMOS-Bildsensor AR023Z verfügt über einen hohen Dynamikbereich und arbeitet auch bei schlechten Lichtverhältnissen zuverlässig.

Der CMOS-Bildsensor AR023Z verfügt über einen hohen Dynamikbereich und arbeitet auch bei schlechten Lichtverhältnissen zuverlässig. ON Semiconductor

Zwischen hell und dunkel

Der Dynamikbereich (DR: Dynamic Range) eines Bildsensors liegt zwischen dem hellsten und dunkelsten Detail eines Bildes, das gleichzeitig erfasst werden kann. Gängige Bildsensoren bieten meist einen Dynamikbereich zwischen 54 und 70 dB. Ein höherer Dynamikbereich lässt sich durch Bildverarbeitung im Sensor oder in einem Bildverarbeitungsprozessor erzielen.

Im HDR-Modus nehmen die Sensoren von On Semiconductor nacheinander zwei Aufnahmen des gleichen Bildes auf, indem zwei getrennte Lese- und Reset-Pointer gesetzt werden, die innerhalb des Rolling-Shutter-Auslesevorgangs verschachtelt werden. Sobald die beiden Belichtungswerte eines Pixels zur Verfügung stehen, werden sie kombiniert, um einen linearisierten Wert für jede Pixel-Antwort zu erzeugen. Alternativ können die Sensoren auch zwei getrennte Datenströme ausgeben, welche die unterschiedlichen Belichtungen repräsentieren und deren Verarbeitung außerhalb des Chips erfolgen kann.

Die erste Serie von DIY-Geräten am Markt basierte auf Sensoren mit einem Standard-Dynamikbereich zwischen 54 und 70 dB. Da die Geräte immer intelligenter und die Anwendungsfälle vielfältiger werden, steigen auch die Anforderungen an einen höheren Dynamikbereich. In Innenräumen ist die Wahrscheinlichkeit geringer, dass große Unterschiede hinsichtlich der Lichtverhältnisse für eine bestimmte Szene auftreten. Kommt das gleiche Gerät im Außenbereich zum Einsatz, können sich jedoch gleichzeitig sehr helle und sehr schattige Bereiche in einer Szene befinden. Von den Kameras wird auch erwartet, dass sie plötzliche Änderungen der Lichtverhältnisse kompensieren, wie das Öffnen einer Tür oder das Ein-/Ausschalten der Beleuchtung. Ein HDR-Bildsensor erkennt dies und sorgt dafür, dass die Bildqualität gleich hoch bleibt.

Hohe Qualität bei wenig Licht

Eine der wichtigsten Anforderungen für IoT-Anwendungen ist eine hohe Bildqualität auch bei schlechten Lichtverhältnissen, denn mit schlechter Lichtempfindlichkeit würde ein intelligentes Kamera-Babyfon die Eltern zur Verzweiflung bringen, eine intelligente Türklingel würde das Gesicht eines Besuchers nicht richtig erfassen und eine Heimüberwachungskamera wäre bei Nacht nutzlos. Um diese Nachteile auszuschalten, sind bei der Wahl des optimalen Bildsensors weitere Kriterien die MTF (Modulation Transfer Function) und der Signal-Rauschabstand (SNR – Signal to Noise Ratio).

Die MTF quantisiert die Fähigkeit eines Sensors, scharfe Bilder bereitzustellen. Die MTF im sichtbaren Lichtspektrum ist sehr konstant, aber bei längeren Wellenlängen ergibt sich bei Infrarot-Ausleuchtung, dem sogenannten Near Infrared (NIR), ein Problem. In diesen Fällen verringert sich die MTF um den Faktor 2 oder 3, was die Auflösung begrenzt und das Erkennen kleiner Details erschwert.

Der SNR als weiteres Kriterium für die Erzeugung eines brauchbaren Bildes steht für das Verhältnis zwischen Signal und Störung (Rauschen) im Bild. Das Rauschen erscheint als Körnigkeit im Bild, das heißt je höher der SNR ist, desto besser ist die Bildqualität. Es gibt zwei Möglichkeiten, den SNR eines Sensors zu erhöhen: entweder durch Verringerung des Rauschanteils und / oder die Erhöhung des Signalanteils. Dabei wird die Antwort des Sensors bezüglich seiner Quanteneffizienz (QE) optimiert, die den Prozentsatz an Photonen repräsentiert, die in Elektronen umgewandelt werden.

Bei schlechten Lichtverhältnissen müssen feine Unterschiede bei den Lichtpegeln erfasst werden. Schon etwas weniger als 1 mV Rauschen auf einem Chip lässt sich im Bild als Störung wahrnehmen. Eine störungsbehaftete Elektronik kann bei schattigen oder schlecht beleuchteten Szenen das erzeugte Low-Level-Signal schnell dominieren. Der Spitzen-SNR-Wert hochleistungsfähiger CMOS-Bildsensoren für IoT-Anwendungen liegt zwischen 39 und 41 dB.

Einige Heimautomatisierungsprodukte werden inzwischen mit RGB-NIR-Bildsensoren ausgestattet. RGB-NIR ist eine Struktur von Farbfiltern auf dem Pixel-Array des Bildsensors, die rote, grüne, blaue und NIR-Photonen einzeln einfängt. Die Bildqualität dieser Sensoren ist stets hoch, sowohl tagsüber, bei niedrigem IR-Anteil, mit einer guten Farbwiedergabe, und nachts, wenn NIR-LEDs aktiv sind, mit guten Schwarzweißbildern. Diese Sensoren machen einen mechanischen IR-Sperrfilter überflüssig.

Auflösung ist nicht alles

Bei der Wahl kamerabasierter Produkte ist für Anwender die Auflösung stets das augenscheinlichste Merkmal. Die ersten IoT-Geräte am Markt boten bis zu 720p (1280 × 720) Auflösung. Für Low-End-Geräte ist dies immer noch die Norm. Für High-End-Geräte und Anwender, die bereit sind, etwas mehr für hervorragende Bildqualität zu bezahlen, sind jedoch 1080p (1920 × 1080) der Standard. Beim Streaming über datenbegrenzte Funkprotokolle durchlaufen Videoaufnahmen meist eine Kompression. Je höher die Kompression, desto komplexer wird die Datenverarbeitung. Dies führt zu einem höheren Stromverbrauch, was bei batteriebetriebenen IoT-Geräten sicher nicht wünschenswert ist. 18-Megapixel-Kameras klingen verlockend, aber als Kompromiss für IoT-Anwendungen sind Kameras mit 2 bis 5 MP Auflösung die beste Lösung.