реклама на сайте
подробности

 
 
> подскажите доступные чипы Cortex-A8 с FPU или Cortex-A9 (вроде бы там FPU по дефолту), что-то типа ОМАР 3/4, но для простых пацанов (не high-volume OEM/ODM)
yes
сообщение May 4 2010, 14:48
Сообщение #1


Гуру
******

Группа: Свой
Сообщений: 2 198
Регистрация: 23-12-04
Пользователь №: 1 640



нашел у ТИ аналог ОМАР 3

http://focus.ti.com/docs/prod/folders/print/am3505.html

# NEON SIMD Coprocessor and Vector floating point (FP) co-processor

сам по себе NEON SIMD это не то, как я понял регистры у него общие с VFP, и далеко не во всяком кортексе при наличии NEON есть и VFP

--------------

может есть менее пафосный производитель чипов, который производит такие кортексы и продает для лоу-вольюм приложений?
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
KRS
сообщение May 4 2010, 20:23
Сообщение #2


Профессионал
*****

Группа: Модераторы
Сообщений: 1 951
Регистрация: 27-08-04
Из: Санкт-Петербург
Пользователь №: 555



Цитата(yes @ May 4 2010, 18:48) *
нашел у ТИ аналог ОМАР 3

Вообще AMxx это industrial(automative) аналог OMAP, там DDR2 уже можно цепялть и ethernet есть.

Вообще 35xx серия доступна поштучно! В отличии от 34xx которая в серийных смартфонах.
Только AM35xx недавно вышел, поэтому его тяжело купить сейчас.
А OMAP35xx без проблем продаются у них у всех есть Neon.
Go to the top of the page
 
+Quote Post
yes
сообщение May 5 2010, 09:44
Сообщение #3


Гуру
******

Группа: Свой
Сообщений: 2 198
Регистрация: 23-12-04
Пользователь №: 1 640



Цитата(KRS @ May 5 2010, 00:23) *
Вообще AMxx это industrial(automative) аналог OMAP, там DDR2 уже можно цепялть и ethernet есть.

Вообще 35xx серия доступна поштучно! В отличии от 34xx которая в серийных смартфонах.
Только AM35xx недавно вышел, поэтому его тяжело купить сейчас.
А OMAP35xx без проблем продаются у них у всех есть Neon.


NEON не нужен, нужен VFPLite (VFPv3)
если я что-то не понимаю - объясните пожалуйста: NEON это single precision SIMD, а VFPLite это double precision
эмуляция даблов через синглы не быстрее эмуляции через инты, поэтому NEON не нужен

OMAP35xx поэтому мне не интересны
а АМ3517 / АМ3505 (ну и ОЕМ ОМАРах) кроме NEON есть и VFP

или я неправильно понял описания ТИ?
Go to the top of the page
 
+Quote Post
SimpleSoft
сообщение May 6 2010, 05:54
Сообщение #4


Местный
***

Группа: Участник
Сообщений: 273
Регистрация: 3-11-05
Пользователь №: 10 442



Цитата(yes @ May 5 2010, 12:44) *
NEON не нужен, нужен VFPLite (VFPv3)
если я что-то не понимаю - объясните пожалуйста: NEON это single precision SIMD, а VFPLite это double precision
эмуляция даблов через синглы не быстрее эмуляции через инты, поэтому NEON не нуже

или я неправильно понял описания ТИ?


В Cortex™-A8 Technical Reference Manual написано:
Цитата
The VFP coprocessor
provides a floating-point computation coprocessor that is fully compliant with the
ANSI/IEEE Std 754-1985, IEEE Standard for Binary Floating-Point Arithmetic,
referred to in this document as the IEEE 754 standard. The VFP coprocessor supports
all data-processing instructions and data types in the VFPv3 architecture and is
described in the ARM Architecture Reference Manual.
Designed for the processor, the VFP coprocessor fully supports single-precision and
double-precision add, subtract, multiply, divide, multiply and accumulate, and square
root operations.
Conversions between fixed-point and floating-point data formats, and
floating-point constant instruction are provided.

а VFPv3 есть и в OMAP35xx

Сообщение отредактировал SimpleSoft - May 6 2010, 05:56
Go to the top of the page
 
+Quote Post
yes
сообщение May 6 2010, 08:35
Сообщение #5


Гуру
******

Группа: Свой
Сообщений: 2 198
Регистрация: 23-12-04
Пользователь №: 1 640



Цитата(SimpleSoft @ May 6 2010, 09:54) *
а VFPv3 есть и в OMAP35xx


а это где-то явно написано?

или точно уверены, что при использовании ОМАР35хх дабловые инструкции выполняются железом, а не эксепшином?

если есть платка с ОМАРом - можете проверить?

из АРМовских док (Cortex-A8 TRM) следует, что VFP (имплементация FPULite) является опцией и существуют ядра как вообще без сопроцессора, так только с поддержкой NEON, так и с поддержкой NEON и VFPv3 (даже больше - имплементаций VFP возможно две разных: с 16 регистрами и 32)

какое ядро использовано в ОМАР35хх я не сумел понять из ТИ-шных док, но складывается впечатление, что только NEON, VFPv3 нет

--------------------

UPD: off: армовские уродливые манагеры сменили достаточно простую систему наименований типа ядро ARM1136JF - все понятно про поддерживаемую ISA, а теперь Сортекс и хрен поймешь какая неонка внутре. дибилизьм на марше
Go to the top of the page
 
+Quote Post
sasamy
сообщение May 6 2010, 11:12
Сообщение #6


Знающий
****

Группа: Участник
Сообщений: 783
Регистрация: 22-11-08
Пользователь №: 41 858



Цитата(yes @ May 6 2010, 12:35) *
а это где-то явно написано?


http://e2e.ti.com/support/dsp/omap_applica...201.aspx#128201
Цитата
All versions of OMAP35xx with the ARM Cortex A8 processor have the VFP core which is single and double precision floating point in hardware.
Go to the top of the page
 
+Quote Post
yes
сообщение May 6 2010, 15:21
Сообщение #7


Гуру
******

Группа: Свой
Сообщений: 2 198
Регистрация: 23-12-04
Пользователь №: 1 640



спасибо, понял, что есть.

но вопрос с производительностью
http://markmail.org/message/b2n6t3xsiorikfw6

или после прочтения документов

Cortex A8 (SP, DP)

FADD 9-10 9-10
FSUB 9-10 9-10
FMUL 10-12 11-17
FNMUL 10-12 11-17
FMAC 18-21 19-26
FNMAC 18-21 19-26
FMSC 18-21 19-26
FNMSC 18-21 19-26
FDIV 20-37 29-65
FSQRT 19-33 29-60

-----------------

ARM11 (VFP10)

FADD, FSUB 1 1
FMUL, FNMUL 1 2
FMAC, FNMAC, FMSC, FNMSC 1 2
FDIV, FSQRT 15 29

в табличке для АРМа взято не латенси, а сруаутпут - конвеер там

то есть VFP10 (от ARM11*F) имеет приблизительно в 10 раз большую производительность за такт, если брать частоту АРМа в 200 (lpc32xx), а Кортекса в 500, то вопрос выбора более производительного чипа в пользу Кортекса далеко не очевиден



Цитата(SimpleSoft @ May 6 2010, 13:29) *
0001A71C fmsr s0, r3
0001A720 fsitos s1, s0
0001A724 flds s0, [sp,#+36]
0001A728 fdivs s0, s0, s1
0001A72C fsts s0, [sp,#+36]


если мне память не изменяет, дабловые инструкции АРМа

fdivd d0, d0, d1
и т.п.

то есть в С-шном исходнике
double fStrip;
Go to the top of the page
 
+Quote Post
sasamy
сообщение May 6 2010, 19:56
Сообщение #8


Знающий
****

Группа: Участник
Сообщений: 783
Регистрация: 22-11-08
Пользователь №: 41 858



Цитата(yes @ May 6 2010, 19:21) *
если брать частоту АРМа в 200 (lpc32xx), а Кортекса в 500, то вопрос выбора более производительного чипа в пользу Кортекса далеко не очевиден


Для меня очевиден - cortex умеет спаривать команды и предсказывать ветвления поэтому при умелой оптимизации код выполняется до 2 раз быстрей на той же частоте, SP за глаза хватает для мультимедиа а их уже NEON с конвеером поддерживает. Смотрите в сторону Sony Playstation 3 - там cell фантастические флопсы показывает smile.gif

Сообщение отредактировал sasamy - May 6 2010, 19:57
Go to the top of the page
 
+Quote Post



Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 23rd June 2025 - 10:46
Рейтинг@Mail.ru


Страница сгенерированна за 0.01472 секунд с 7
ELECTRONIX ©2004-2016