|
|
  |
Cortex-M7, Не угнаться. |
|
|
|
Sep 29 2014, 12:28
|
Участник

Группа: Участник
Сообщений: 55
Регистрация: 13-09-12
Пользователь №: 73 530

|
Цитата(Genadi Zawidowski @ Sep 26 2014, 00:59)  Обратите внимание на ARMv7-M у Cortex M7 и Thumb® / Thumb-2 у Cortex M4. Если я не ошибаюсь, опять отказались от экономии размера программного кода и инструкции позволяют адресовать больше регистров. Cortex-M3, -M4, -M7, все они реализуют одну и ту же архитектуру ARMv7-M с набором команд Thumb 2, так что никто ни от чего не отказался и продолжает экономить память, а очень жаль, ибо последняя стоит копейки и урезать набор инструкций из-за сомнительной экономии в пару десятков процентов мне кажется абсурдным.
Сообщение отредактировал menzoda - Sep 29 2014, 12:29
|
|
|
|
|
Sep 29 2014, 13:24
|
Участник

Группа: Участник
Сообщений: 55
Регистрация: 13-09-12
Пользователь №: 73 530

|
Во-первых, сама ARM заявляет преимуществом урезанного набора команд именно экономию памяти, а не скорость доступа к ней, поэтому я и рассматриваю данное заявление с этой стороны. Во-вторых, мне кажется длина инструкции не влияет на скорость доступа к памяти. Да, 32-битную шину провести сложнее, чем 16-битную, но ведь инструкции там не 16-битные, а смешанного типа, так что всё-равно приходится иметь дело с длинными инструкциями. Да и если судить по взрослым ядрам того же ARM большая длина инструкций никак не мешает им (ядрам) работать на высокой частоте. Ну и в-третьих, по моему, набор инструкций одной длины поддерживать легче, ядро было бы проще.
|
|
|
|
|
Sep 29 2014, 16:15
|
Гуру
     
Группа: Свой
Сообщений: 5 228
Регистрация: 3-07-08
Из: Омск
Пользователь №: 38 713

|
Цитата(menzoda @ Sep 29 2014, 19:24)  Во-первых, сама ARM заявляет преимуществом урезанного набора команд именно экономию памяти, а не скорость доступа к ней, поэтому я и рассматриваю данное заявление с этой стороны. Во-вторых, мне кажется длина инструкции не влияет на скорость доступа к памяти.. Чтобы не казалось, загляните в reference manual на любой M3/M4 с flash.  Увидите, что при частоте CPU уже приближающейся к 200МГц, частота flash остаётся ~20-30МГц. Учитывая, что к примеру в STM32F4x шина выборки команд шириной ==128бит, получается, что для одной 128бит выборки кода на частоте CPU ==168МГц нужно 6-8тактов, а если эта выборка заполнена сплошь 32-битными инструкциями, то выполнится она за 4 такта и ещё 2-4 такта CPU будет стоять ожидая следующей выборки. И это не учитывая других bus masters на шине. У других вендоров M3/M4 всё примерно так же. Ну за исключением Tiva с её 256-битной шиной предвыборки. Конечно почти во всех последних ядрах уже есть кеши, но всё-же всё-же.... малый размер инструкции это не только размер кода, но часто и скорость выполнения тоже. Цитата(menzoda @ Sep 29 2014, 19:24)  Да и если судить по взрослым ядрам того же ARM большая длина инструкций никак не мешает им (ядрам) работать на высокой частоте. Только исключительно благодаря кешам и только!
|
|
|
|
|
Sep 29 2014, 17:45
|

Профессионал
    
Группа: Участник
Сообщений: 1 620
Регистрация: 22-06-07
Из: Санкт-Петербург, Россия
Пользователь №: 28 634

|
Цитата речь про DP FPU У STM32F7xx только single... Цитата The STM32F756xx devices are based on the high-performance ARM® Cortex®-M7 32-bit RISC core operating at up to 200 MHz frequency. The Cortex®-M7 core features a single floating point unit (SFPU) precision which supports all ARM® single-precision data-processing instructions and data types. It also implements a full set of DSP instructions and a memory protection unit (MPU) which enhances application security.
Сообщение отредактировал Genadi Zawidowski - Sep 29 2014, 17:47
|
|
|
|
|
Oct 1 2014, 06:51
|
Гуру
     
Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521

|
И, кстати, пока ещё ключей типа fpu64 не просматривается нигде ... )) Я читал обзор по ARM где-то. Они уже разработали 64 битный проц. Пишут что совместимость полная с 32-ух битным. Особо отмечено, что учтены грабли x86 процов. Пишут что плавучка тоже 64 битная + значительно расширена система комманд. Ну и всякие там SIMD и NEON ... 8 ядер и так далее ... )) Понятно, что это всё для PDA и т.п. А тут ещё глядишь как то странно анонс win10 вчера прозвучал .... "Windows 10 - это ещё один шаг к объединению нескольких версий ОС компании, устанавливаемых на смартфоны, компьютеры и игровые консоли Xbox. Отныне разработчики смогут создавать универсальные приложения, совместимые со всеми упомянутыми выше устройствами. Соответствующие инструменты уже доступны в Microsoft Visual Studio 2013 Update 2. " Есть ощущение, что наконец ARM процы будут поддерживаться. Или я ошибаюсь? )) Короче, ещё немного и какое-нибудь моё устройство под виндой будет работать ...
|
|
|
|
|
Nov 11 2014, 19:02
|
Частый гость
 
Группа: Участник
Сообщений: 177
Регистрация: 24-03-07
Пользователь №: 26 471

|
Если верить CoreMark, новый камушек уже сравним по производительности с Pentium II. Цитата(Xenia @ Sep 25 2014, 23:32)  Где вы это прочли (про двойную точность)? Я специально на этот счет в даташите на STM32F756xx копалась, но там везде написано "single floating point precision". Как??? пойду повешусь...
|
|
|
|
|
  |
4 чел. читают эту тему (гостей: 4, скрытых пользователей: 0)
Пользователей: 0
|
|
|