运行裸机(无操作系统,无 Linux)
规格表明 ARM 可以/确实运行 700MHz,系统时钟与手册相匹配,并且似乎以 250MHz 运行。ARM 上的简单测试表明它正在做同样的事情,例如指令缓存打开
test:
subs r0,r0,#1
bne test
并且改变 subs 指令的数量来控制分支,它在 250MHz 的范围内,但距离 700MHz 有很长的路要走。
我在数据表中没有看到用于倍增 ARM 时钟的 phy 设置?
编辑:
也许我的假设是有缺陷的......
.globl ARMTEST0
ARMTEST0:
subs r0,r0,#1
bne ARMTEST0
bx lr
.globl ARMTEST1
ARMTEST1:
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
bne ARMTEST1
bx lr
.globl ARMTEST2
ARMTEST2:
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
subs r0,r0,#1
bne ARMTEST2
bx lr
.globl ARMTEST3
ARMTEST3:
subs r1,r0,#1
subs r2,r1,#1
subs r3,r2,#1
subs r0,r3,#1
subs r1,r0,#1
subs r2,r1,#1
subs r3,r2,#1
subs r0,r3,#1
subs r1,r0,#1
subs r2,r1,#1
subs r3,r2,#1
subs r0,r3,#1
subs r1,r0,#1
subs r2,r1,#1
subs r3,r2,#1
subs r0,r3,#1
bne ARMTEST3
bx lr
每个函数的系统计时器以十六进制计时(250Mhz 系统计时器已根据秒表等进行验证)。
02DB6DF7 ARMTEST0
02DB6E1C ARMTEST0
00AB6E2A ARMTEST1
00836E46 ARMTEST2
00836E2A ARMTEST3
这使:
ARMTEST0
0x01000000 subs instructions
0x01000000 bne instructions
0x02000000 instructions
1.43 clocks per instruction. 175Mips.
ARMTEST1
0x01000000 sub instructions
0x00200000 bne instructions
0x01200000 instructions
1.68 instructions per clock. 420Mips
ARMTEST2
0x01000000 sub instructions
0x00100000 bne instructions
0x01100000 instructions
2.07 instructions per clock. 517Mips
ARMTEST3
0x01000000 sub instructions
0x00100000 bne instructions
0x01100000 instructions
2.07 instructions per clock. 517Mips
ARM11 是超标量,每个时钟多条指令并不意外。我会期待更多。仅使用寄存器 0 可能会弄乱管道,因为您必须在执行下一条指令之前等待一条指令的一个结果。我期待看到测试 2 和 3 之间的差异,这可能是另一个错误的假设。也许它真的是 500Mhz 而不是 700?linux 源代码中有一行提到了 500000000 时钟。
static struct clk osc_clk = {
#ifdef CONFIG_ARCH_BCM2708_CHIPIT
.rate = 27000000,
#else
.rate = 500000000, /* ARM clock is set from the VideoCore booter */
#endif
};
/* warning - the USB needs a clock > 34MHz */
#ifdef CONFIG_MMC_BCM2708
static struct clk sdhost_clk = {
#ifdef CONFIG_ARCH_BCM2708_CHIPIT
.rate = 4000000, /* 4MHz */
#else
.rate = 250000000, /* 250MHz */
#endif
};
#endif
也许我认为我测量的 250Mhz 是 270,而 ARM 是 500MHz?
EDIT2...DOH
这不是一个很好的管道改进,这是更好的:
.globl ARMTEST3
ARMTEST3:
subs r0,r0,#1
nop
nop
nop
nop
nop
nop
nop
nop
subs r0,r0,#1
nop
nop
nop
nop
nop
nop
nop
nop
subs r0,r0,#1
nop
nop
nop
nop
nop
nop
nop
nop
subs r0,r0,#1
nop
nop
nop
nop
nop
nop
nop
nop
subs r0,r0,#1
nop
nop
nop
nop
nop
nop
nop
nop
subs r0,r0,#1
nop
nop
nop
nop
nop
nop
nop
nop
subs r0,r0,#1
nop
nop
nop
nop
nop
nop
nop
nop
subs r0,r0,#1
nop
nop
nop
nop
nop
nop
nop
nop
bne ARMTEST3
bx lr
ARMTEST3
0x01000000 sub instructions
0x08000000 nop instructions
0x00100000 bne instructions
0x09100000 instructions
037000D7 system clocks
2.64 instructions per clock. 659Mips
一开始config.txt没能正常工作,然后重新建了一个linux sd卡,开机发现/boot/目录其实是包含gpu引导文件和kernel.img arm boot的fat分区文件。所以不在 boot/ 目录中,而是在与 .bin 和 .elf 和 .img 文件相同的目录中创建 config.txt 并放置 arm_freq=something,然后 gpu 引导加载程序对 pll 乘数进行修改,以便在 arm 启动时就是这样的速度。我仍然预计每秒有超过 7 亿条指令,但我没有看到,我猜需要继续尝试。