Come posso stimare la velocità di questa sezione di codice per questo microcontrollore?

ty_1917

2020-01-09 17:00:38 UTC

view on stackexchange narkive permalink

Sto usando un ATmega328P per leggere lo stato di un ingresso digitale utilizzando la seguente sezione di codice scritta in C (ci possono essere modi alternativi, ma questo è un esempio). val è un tipo di variabile uint8_t e memorizza lo stato del pin di ingresso digitale:

Ecco la parte del codice:

  if ((PIND & (1 << PIND6)) == (1 << PIND6)) {
    val = 1;
} altro {
    val = 0;
}

Ho impostato l'orologio come segue:

  #define F_CPU 16000000UL

Immagina che l'ingresso digitale sia un treno di impulsi ON / OFF con un ciclo di lavoro del 50% e che ne aumentiamo gradualmente la frequenza. Ad un certo punto a una certa frequenza il codice precedente non dovrebbe essere in grado di acquisire correttamente lo stato dell'ingresso digitale.

Come possiamo stimare approssimativamente la frequenza di impulsi massima che il codice sopra può gestire per leggere lo stato corretto?
Dovremmo trovare quanti cicli di clock utilizza e moltiplicarli per la frequenza di clock?

E se sì, come posso farlo in pratica?

  int main (void) {

    DDRD = B0100000;
    DDRD | = 1<<5;

    while (1) {

        dati lunghi senza segno = 0;
        uint8_t val;

        for (int i = 0; i<25; i ++) {
            dati << = 1;
            PORTD & = ~ (1 << 5);
            _delay_us (2);
            PORTD | = (1 << 5);
            _delay_us (2);

            if ((PIND & (1 << PIND6)) == (1 << PIND6)) {
                val = 1;
            }
            altro {
                val = 0;
            }

            dati | = val;
        }

        // Il resto del codice

    }
}

Mi aspetto che questo catturi lo stato dell'ingresso digitale correttamente, ogni volta che viene eseguito, a qualsiasi frequenza.La domanda è: quanto spesso puoi eseguire questo codice?

Puoi scrivere il tuo codice semplicemente come `val = ((PIND & (1 << PIND6)) == (1 << PIND6));`, o `val = ((PIND >> PIND6) & 1);` (e probabilmente un sacco di altri modi).È necessario esaminare l'output del compilatore per vedere se si ottiene un codice assembly diverso in ogni caso e quale è il più veloce.

Hai provato un profiler hardware per * misurare * invece di * stimare *?

Il tuo nuovo codice ha lo stesso problema del vecchio codice: - `val` e` data` non vengono utilizzati, quindi verranno ottimizzati.

int main (void) { volatile uint8_t val = 0; mentre (1) { if ((PIND & (1 << PIND6)) == (1 << PIND6)) { val = 1; } altro { val = 0; } } }

val = 1; 00000046 LDI R24,0x01 Carico immediato, 1 ciclo di clock if ((PIND & (1 << PIND6)) == (1 << PIND6)) { 00000047 SBIS 0x09,6 Salta se il bit nel registro I / O è impostato, 1/2 ciclo di clock 00000048 RJMP PC + 0x0003 Salto relativo, 2 cicli di clock val = 1; 00000049 STD Y + 1, R24 Memoria indiretta con spostamento, 2 cicli di clock 0000004A RJMP PC-0x0003 Salto relativo, 2 cicli di clock val = 0; 0000004B STD Y + 1, R1 Memoria indiretta con spostamento, 2 cicli di clock 0000004C RJMP PC-0x0005 Salto relativo, 2 cicli di clock

int main (void) { 86: 89 e1 ldi r24, 0x19; 25 88: 90 e0 ldi r25, 0x00; 0 uint8_t val; for (int i = 0; i<25; i ++) { dati << = 1; PORTD & = ~ (1 << 5); 8a: 5d 98 cbi 0x0b, 5; 11 // _delay_us (2); PORTD | = (1 << 5); 8c: 5d 9a sbi 0x0b, 5; 11 // _delay_us (2); if ((PIND & (1 << PIND6)) == (1 << PIND6)) { 8e: 29 b1 in r18, 0x09; 9 90: 01 97 sbiw r24, 0x01; 1 while (1) { uint8_t val; for (int i = 0; i<25; i ++) { 92: d9 f7 brne.-10; 0x8a <main + 0xa> 94: f8 cf rjmp.-16; 0x86 <main + 0x6>

while (1) { uint8_t val; for (int i = 0; i<25; i ++) { dati << = 1; 90: 88 0f aggiungi r24, r24 92: 99 1f adc r25, r25 94: aa 1f adc r26, r26 96: bb 1f adc r27, r27 PORTD & = ~ (1 << 5); 98: 5d 98 cbi 0x0b, 5; 11 // _delay_us (2); PORTD | = (1 << 5); 9a: 5d 9a sbi 0x0b, 5; 11 // _delay_us (2); if ((PIND & (1 << PIND6)) == (1 << PIND6)) { 9c: 49 b1 in r20, 0x09; 9 } altro { val = 0; } dati | = val; 9e: 46 fb bst r20, 6 a0: 44 27 eo r20, r20 a2: 40 f9 bld r20, 0 a4: 84 2b o r24, r20 a6: 21 50 subi r18, 0x01; 1 a8: 31 09 sbc r19, r1 while (1) { uint8_t val; for (int i = 0; i<25; i ++) { aa: 91 f7 brne.-28; 0x90 <main + 0x10> } dati | = val; } PORTD = (uint8_t) dati; ac: 8b b9 out 0x0b, r24; 11 // Il resto del codice } ae: ee cf rjmp.-36; 0x8c <main + 0xc>

while (1) { uint8_t val; for (int i = 0; i<25; i ++) { dati << = 1; 9a: 40 91 00 01 lds r20, 0x0100; 0x800100 <_edata> 9e: 50 91 01 01 lds r21, 0x0101; 0x800101 <_edata + 0x1> a2: 60 91 02 01 lds r22, 0x0102; 0x800102 <_edata + 0x2> a6: 70 91 03 01 lds r23, 0x0103; 0x800103 <_edata + 0x3> aa: 44 0f aggiungi r20, r20 ac: 55 1f adc r21, r21 ae: 66 1f adc r22, r22 b0: 77 1f adc r23, r23 b2: 40 93 00 01 punti 0x0100, r20; 0x800100 <_edata> b6: 50 93 01 01 punti 0x0101, r21; 0x800101 <_edata + 0x1> ba: 60 93 02 01 punti 0x0102, r22; 0x800102 <_edata + 0x2> essere: 70 93 03 01 m 0x0103, r23; 0x800103 <_edata + 0x3> PORTD & = ~ (1 << 5); c2: 5d 98 cbi 0x0b, 5; 11 // _delay_us (2); PORTD | = (1 << 5); c4: 5d 9a sbi 0x0b, 5; 11 // _delay_us (2); if ((PIND & (1 << PIND6)) == (1 << PIND6)) { c6: 29 b1 in r18, 0x09; 9 } altro { val = 0; } dati | = val; c8: 26 fb bst r18, 6 ca: 22 27 per r18, r18 cc: 20 f9 bld r18, 0 ce: 40 91 00 01 lds r20, 0x0100; 0x800100 <_edata> d2: 50 91 01 01 lds r21, 0x0101; 0x800101 <_edata + 0x1> d6: 60 91 02 01 lds r22, 0x0102; 0x800102 <_edata + 0x2> da: 70 91 03 01 lds r23, 0x0103; 0x800103 <_edata + 0x3> de: 42 2b o r20, r18 e0: 40 93 00 01 punti 0x0100, r20; 0x800100 <_edata> e4: 50 93 01 01 punti 0x0101, r21; 0x800101 <_edata + 0x1> e8: 60 93 02 01 punti 0x0102, r22; 0x800102 <_edata + 0x2> ec: 70 93 03 01 punti 0x0103, r23; 0x800103 <_edata + 0x3> f0: 01 97 sbiw r24, 0x01; 1 while (1) { uint8_t val; for (int i = 0; i<25; i ++) { f2: 99 f6 brne.-90; 0x9a <main + 0xa> f4: d0 cf rjmp.-96; 0x96 <main + 0x6>