Saturday, June 3rd, 2017 05:38 am (UTC)
Зачем восемь графических ядер? Или это "ускоритель интернета ИИ"? :)
Saturday, June 3rd, 2017 05:42 am (UTC)
Это поди чтоб на какой новой Таволге было можно нормально "работать" государственным мужам отрабатывая стратегию и тактику спасения птичьих яиц на свинячем острове :)
[identity profile] oppad (from livejournal.com)
Saturday, June 3rd, 2017 07:12 am (UTC)
все так делают, фиг найдешь мобильный процессор с высокой производительностью, но без этих самых ядер
Saturday, June 3rd, 2017 07:57 am (UTC)
Недавно Ксилинкс сделал космическую версию 16нм FPGA (RT-ZU19EG). Там кроме ведра ядер АРМа есть и GPU Mali-400. Вот кому в космосе он будет картинки рисовать? Потому подозрение на "ускоритель ИИ", хотя и это непонятно кому в космосе нужно. Может ради FPU? Но тогда лучше было бы нормальный FPU поставить. А чипы такие стоят порядка 50 килобаксов или больше -- мусор получается небесплатный.
Saturday, June 3rd, 2017 08:25 am (UTC)
"Вот кому в космосе он будет картинки рисовать?"

Может наоборот, будет сжимать картинки? Какие-нибудь фото-видео.
Saturday, June 3rd, 2017 08:35 am (UTC)
Такие алгоритмы обычно целочисленные, а на чипе ведро ядер АРМа и обычных для большой FPGA арифметических ядер, памяти и логики. Чтобы понять как выглядит правильный процессор для таких задач, лучше всего посмотреть на TI 6657, хотя он и не космический. Вот если бы сделали FPGA с антифьюзами и таким процессором, была бы полезная в космосе зверюга. А так у Ксилинкс получился чип с мягкой памятью и непонятного назначения GPU. Они конечно клянутся что мягкая память минимально влияет на частоту ошибок, но мы-то знаем. Битфлип в конфигурационной памяти может сделать сразу несколько логических ошибок, каждая из которых создаёт каскад до десятков тысяч неправильных битов. Ладно если это какой-то спутник связи -- там резервирование колоссальное, ну потухнет один канал из сотни на несколько минут до перезагрузки. Но в системе управления такое ставить можно только врагам -- фиг докажешь почему спутник "сделал себе Хитоми". :)
Saturday, June 3rd, 2017 08:58 am (UTC)
Я в тонкостях проектирования ПЛИСок для космоса не разбираюсь честно говоря, но после информации о том, что марсианские роверы работают на Бейсике Яве уже ничему не удивлюсь. Тогда и "8 ядер ARM" в тему - эдакий космический Андроид. Хотя Ява, есть мнение, убила в своё время мобильные устройства и продолжает это делать.
[identity profile] oppad (from livejournal.com)
Sunday, June 4th, 2017 02:44 pm (UTC)
по-моему это не тот ускоритель, для мпегов/жпегов еще один нужно ставить, mali этого не умеет.
но могу ошибаться, с графическими ускорителями имел дело очень давно
Sunday, June 4th, 2017 03:56 pm (UTC)
Это ж для смартфонов, умеет:
For encode: HEVC Main, H.264, VP8, JPEG
For decode: HEVC Main 10, HEVC Main, H.264, H.263, MPEG4, MPEG2, VC-1/WMV, Real, VP8, JPEG

The Mali-V550 tightly integrates the latest standards, including 8 and 10-bit HEVC decode and an 8-bit HEVC encode compliant bit stream.

А тот мпег, который был в годы, когда для жпега нужен был ускоритель сегодня в калькуляторах считается.
[identity profile] oppad (from livejournal.com)
Sunday, June 4th, 2017 02:58 pm (UTC)
если есть алгоритм кипячения пустого чайника, то как закипятить наполненый?
- вылить воду и воспользоваться существующим алгоритмом.

то есть во фронтенде у них готовые оттестированные цинки уже были - перенести его на RH библиотеку могло потребовать меньше усилий и дать меньшую вероятность ошибки, чем выдергивать ускоритель из кода

кстати в 5 виртексе RH (который довелось попользовать) название FX130 и весь софт разработчика (совпадающий с коммерческим чипом, в котором РРС есть) предполагали наличие РРС ядра, но его там нет, по крайней мере оно не доступно отечественным пользователям (подозреваю, что сейчас из-за "напряженности в госотношениях" и сами чипы недоступны отечественным пользователям)
вот мне интересно - пронесли они что-то в стойком чипе, что ядро не заработало или другая причина?
это кстати могло мотивировать космическую команду ксайлинса впихнуть ядро понавороченнее, чтобы показать что они не лохи
Sunday, June 4th, 2017 03:32 pm (UTC)
Не знал что есть пятые виртексы с отключённым РРС. Думаю без политики не обошлось -- чипы по 50 килобаксов, производителю нет смысла что-то отключать. Хотя я убеждён что ХХ пошли неправильным путём: мягкая память для конфигурации в космосе не должна оказываться, что бы они ни говорили о минимальном влиянии и большой стойкости. И стандарты, и испытания сделаны на основе старой научной базы, которая делалась для электроники восьмидесятых, когда транзисторы измерялись в микронах, а частоты в мегагерцах. А сегодня диаметр транзистора измеряется в десятках нм, а диаметр воронки плазменного канала (от лучей) -- 100~150нм, время его жизни -- порядка 1нс. Что будет с таким транзистором, если нейтрон запустит каскад ядерных реакций внутри него (деление ядра, альфы и прочие осколки ядра, импульс в решётку от торможения осколков, горячие электроны вылетают с нижних орбиталей, релаксационные гаммы и рентген от всего этого), и так понятно -- ничего хорошего. Более того! Благодаря уменьшению транзистора, величина критического заряда в чувствительном объёме уменьшилась до уровня, при котором даже мюоны оставляют достаточно энергии для сбоев. И вот при всех этих делах, у ХХ чипы с сотнями миллионов конфигурационных бит, каждый из которых может дать десятки тысяч логических ошибок. Такую скотину лучше пусть себе оставят, но я не понимаю почему до сих пор не спионерили технологию антифьюзов. Что, так сильно заняты, или денег нет?
[identity profile] oppad (from livejournal.com)
Sunday, June 4th, 2017 07:51 pm (UTC)
там только один мембер в семействе 5QV, а по поводу нейтронных воздействий - я не обладаю достаточными знаниями (мы уже обсуждали когда-то что-то похожее)

про антифузы - могу предположить два варианта 1) защищено патентами 2) уж очень говеные характеристики у актеловских ПЛИС - возможно из-за свойств антифуза (например, минимально возможного размера)

из общих соображений - антифузы это только соединения, триггера и логика там на КМОПе, ну и на длинных "проводах" наверняка стоят буфера - то есть и интерконнект в антифузной ПЛИС имеет транзисторы. то есть насколько большой выигрыш на антифузах - не понятно


Sunday, June 4th, 2017 10:10 pm (UTC)
1. Патенты защищают от конкуренции, а не от использования в собственных целях.
2. Какие именно характеристики? На них процессоры (LEONx) помещаются с каким-никаким FPU. :)
Антифьюз -- это стабильное соединение, что делает всю схему стабильной. Действие радиации проявляется как в любой схеме -- на уровне состояния элементов, но не влияет на их конфигурацию. Состояния нетрудно резервировать, но если конфигурация схемы глючит немыслимым образом, резервировать можно только на уровне второго и третьего аналогичного аппарата. Был килограмм железа, стало минимум три, и неважно насколько большой чип и его ресурсы.
[identity profile] oppad (from livejournal.com)
Wednesday, June 7th, 2017 06:15 am (UTC)
я оценивал синтез LEONов (а после P&R результаты еще) для антифузов, у LEON3 без FPU и 16к кэшем тактовая порядка 30МГЦ, с FPU меньше 20, LEON4 не лезет в самый большой чип (Гейслер продает прошитые антифузы на 35МГц, но там без FPU, кэша, средств отладки и т.д - сильно урезанная версия)
для лоу-кост альтер/ксайлинсов для такой же конфигурации получалось 100-150МГц
Wednesday, June 7th, 2017 08:25 am (UTC)
Это цена надёжности. Но вот зачем запихивать туда кэш, заплатив за надёжность антифьюзов -- загадка природы, потому что антифьюзы не спасают от битфлипов в памяти. У него предлагается куча вариантов LEON3, хотя файлу уже полтора года, и могло что-то добавиться:

Из показанных вариантов привлекает лишь крайний справа, и то едва. Вы синтезировали LEON4 в Xilinx? Я помню глянул его код -- глаза сломать можно.
[identity profile] oppad (from livejournal.com)
Wednesday, June 7th, 2017 11:57 am (UTC)
при кэше 16к (4Kх4) производительность вдвое возрастает на реальных задачах, и у Гейслера плохо сделаны АМВА интерфейсы (использует много WAITов) и контролеры памятей (не говорю про SDRAM, там вообще беда, про асинхронные) может 3-6 тактов тратить на обращение

и в этой табличке FPU упрощенный, с последовательными вычислениями (и соотв. производительностью)

по поводу кода - по-моему стиль Гейслера оправдывает существование VHDL - пока его grlib не разобрал, вообще не понимал зачем VHDL придумали :) да, то что IU описан одним файлом сильно усложняет, но почему так сделано - мне понятно

мы выпустили несколько чипов с мультипроцессорным LEON3/LEON4 - LEON4 сильно выигрывает по тактовой, ну и производительность на такт выше - в процессе прототипировали на ПЛИС и Альтере и Ксайлинсе - достаточно долго я этим занимался :)

большая проблема - наличие ошибок в коде Гейслера, как в сложных узлах (FPU, cache), так и во всякой ерунде типа UART-а - у меня сложилось впечатление, что там очень мало (2-3) человек этот код пишут/поддерживают. восновном общался с ними до того как их Аэрофлекс купил, может сейчас поменялась ситуация (но вряд ли, слышал, что находят ошибки и сейчас).
пример неприятной ошибки, пронесенной нами в АЗИК - если чтение данных FPU попадало в "нужной" фазе выборки кода (строки icache), то данные FPU портились - хорошего воркэраунда так и не нашли - подбирали NOP-ами, чтобы не было таких совпадений (сама ошибка происходит крайне редко, на ПЛИСах при подготовке не увидели)

Wednesday, June 7th, 2017 06:23 pm (UTC)
Как интересно. А кто это "вы"? :) niiet.ru? 1906BМ016?

Я предполагал что у него всё запихано по-минимуму, но не знал что оно ещё и глюкавое.
А насчёт кэша, без кодов коррекции, и даже с ними, это генератор логических сбоев. Проблема в множественных сбоях от одной частицы (нейтроны в основном): одиночные сбои и их коррекция -- это решение для протонов и ионов, а нейтроны дают множественные сбои в памяти, а если это в кэше, слогический сбой может быстро расползтись. Видел коэффициент каскада логических сбоев порядка 10к. Без кэша будет медленнее, но надёжнее; а с учётом перезапусков зависшей или нагадившей программы, может оказаться и быстрее. Горе с нейтронами в том что попадание ионов в атом даёт каскад частиц, дающих порядка тыщи нейтронов и ещё кучу побочных эффектов (гаммы, рентгер, горячие электроны, смещённые атомы, осколки деления), в том числе внутри самого чипа. :) Когда транзисторы были большими, всё это помещалось в один сбой, а при хХ нм жизнь стала интересной.

Кстати, что скажете о новых российских клонах классических ядер в радхарде? Я видел С96 (1874ВЕ71Т), ну и вообще деятельность бурлит.
[identity profile] oppad (from livejournal.com)
Wednesday, June 7th, 2017 07:15 pm (UTC)
мы - инофирма, где я одно время работал. центр разработки в РФ

не по минимуму, а вобщем-то LEON3 это что-то на уровне ARM9, LEON4 - ARM11 при этом можно делать труЪ SMP с нормальной инвалидацией кэша, и все очень сильно конфигурируемое, а не как у АРМА - "берите, что дают"
в LEON3FT сделана защита кэша, регистров, EDAC на внешнюю память - при этом это все поддерживается софтом

то есть, мое мнение - Гейслер молодец

----------------

с радхардом я работал только с ПЛИС - с процессорами только читал доки

[identity profile] oppad (from livejournal.com)
Saturday, June 3rd, 2017 07:17 am (UTC)
а с МИПСом значить не пошло? ну кроме АРМа еще есть на продажу SH ядра, РРС по-моему еще можно, ARC (Synopsys) тоже в высокопроизводительный сегмент целит и т.д.
да и букв в русском алфафите много, то есть сплошное забайкалье при наличии бюджета :)

тратили бы уж бабло с фантазией, на опенспарке например бы сделали - все-таки интереснее было бы
Saturday, June 3rd, 2017 09:51 am (UTC)
Термин забайкалье мне нравится, но вот мода давать сейчас микросхемам названия и не присваивать серию с регистрацией в каком Дейтоне, делает кмк сразу микросхему неправильной. Посмотрим, что дальше получится. Хоть от одного байкала увидим четвёртое поколение (ну хоть третье поколение процессоров с одной архитектурой), или будет их и дальше метать по разным архитиктурам.
Saturday, June 3rd, 2017 07:40 am (UTC)
С днём рождения! Больше хороший новостей! :)
Saturday, June 3rd, 2017 07:43 am (UTC)
Благодарю! Надеюсь будут.
vak: (Default)
[personal profile] vak
Saturday, June 3rd, 2017 07:56 am (UTC)
До 8 ядер это как? Сами не знают, сколько в конце концов получится?
Saturday, June 3rd, 2017 07:58 am (UTC)
Если продать кому-нибудь получится, тогда узнают кмк.
Saturday, June 3rd, 2017 08:26 am (UTC)
Не хватает справки сколько стоит заказать подобный проц у какой-нибудь корейской конторы.
Saturday, June 3rd, 2017 09:46 am (UTC)
А чем она поможет при неизвестной цене и условиях от байкаловцев?!
Saturday, June 3rd, 2017 09:22 am (UTC)
С днём рожденья!
Желаю тебе сбычи мечт, здоровья и долголетия!
Saturday, June 3rd, 2017 09:45 am (UTC)
Спасибо, по таким погодам здоровье очень пригодится.
Saturday, June 3rd, 2017 09:50 am (UTC)
Да уж, не Доминиканская республика!
Saturday, June 3rd, 2017 10:14 am (UTC)
Поздравляю!
Saturday, June 3rd, 2017 10:15 am (UTC)
Благодарю.
Saturday, June 3rd, 2017 05:48 pm (UTC)
Если оно будет стоить 5-6 тыр, то замечательно!
Saturday, June 3rd, 2017 06:09 pm (UTC)
Хочется верить в не импортозаместительную цену.
Sunday, June 4th, 2017 01:05 pm (UTC)
Верить-то хочется, но суровая правда жизни куда как хуже! Если даже несчастные STM32-аналоги вместо 100р за штучку стоят чуть ли не 5 килорублей…
Saturday, June 3rd, 2017 06:48 pm (UTC)
Всякого счастья и успехов.!
Sunday, June 4th, 2017 02:01 pm (UTC)
Благодарю!
vak: (Default)
[personal profile] vak
Saturday, June 3rd, 2017 10:23 pm (UTC)
Вообще-то страничка про Байкал-М уже три года там висит.
http://24gadget.ru/1161058465-processor-baikal-rossiyskiy-otvet-intel-i-amd.html

Однако с днём рождения!
Sunday, June 4th, 2017 09:20 am (UTC)
Спасибо,

Шум про Байкал отсюда пошёл по новой
http://pc.watch.impress.co.jp/docs/news/event/1063041.html
Monday, June 5th, 2017 10:54 pm (UTC)
С днём рождения!
Tuesday, June 6th, 2017 04:03 am (UTC)
Спасибо