Lambda Knight

+794
с 2022
2 подписчика
0 подписок

Откуда вернулись? Из Швейцарии, Германии, Нидерландов, США? Попахивает враньем. Из Грузии, Казахстана? Тогда это какая-то выборка не очень хороших айтишников, потому что сейчас с приличным опытом несложно найти работу.

Из знакомых сеньоров/мидлов или ученых/аспирантов с публикациями в зарубежных изданиях вернулось пара человек из более сотни, все разъехались по Европам, США, Израиль, даже Китай. Вернулись из окружения в основном студенты, джуны и псевдоайтишники с парой лет опыта в вебшопе после скилбокса, т.е. те, кому из СНГ было не переехать.

10

В Швеции на визу надо буквально контракт и паспорт и все, даже свидетельство о браке не нужно. В Германию тоже сравнительно изи попасть по IT визе или голубой карте (если диплом есть), нужен контракт и минимум бумаг, и податься можно хоть из Грузии или Сербии. В Нидерланды тоже сравнительно легко попасть по рабочей визе, тоже кроме контракта минимум бумаг, и тоже можно податься из Грузии или Сербии без внж.

Стоит обычно в районе 75 евро + перевод дипломов в зависимости от стоимости услуг переводчика.

1

наивным думать о том что люди поменялись

Люди может и не поменялись, а вот ценность человеческого капитала (читай цена смертей на войне), ценность других факторов производства (читай, низкая цена захватываемой земелюшки и станков), а также связность и распределенность цепочек производства (читай, реагенты для литографии TSMC производятся где-то в Скандинавии и без них парализует в том числе американский впк) очень сильно поменялись.

Собсна, потому сейчас все войнушки — это проксиразборки в странах, которые в это все не успели плотно встроиться.

Наличием GrapheneOS, ну и соотношение цена/качество/срок поддержки пока лучше у пихеля.

2

Инструкции на слайде не имеют отношения к спекулятивному исполнению, как оно понимается применительно к суперскалярным процессорам. ld.s и chk.s выполняются in-order и всегда. ld.s просто инициирует чтение, а chk.s его прерывает, либо дожидается выполнения.

Процессор с OOE пайплайном же может выполнить инструкции чтения под бранчем, а может и нет, и делает это он на основе динамических данных об исполнении (например, частоте перехода по бранчу в тайтлупе).

Более того, OOE процессор может выполнить несколько чтений, он может поменять их местами, если ему так удобнее, он может чередовать их с также спекулятивно исполняемыми арифметическими операциями и реордерить в зависимости от того, какое чтение выполнилось раньше (например из-за доступности значения в кэше).

На слайде литерали причина провала итаниума, потому что откуда компилятору неоткуда знать, в каком порядке и как начинать подгружать значения из памяти. Гцц по дефолту даже не использует эти инструкции.

А они "замещают"? Ну то есть много у нас граждан Таджикистана, Узбекистана и проч. рвутся паспорт получить?

1

ты бы еще с КР580ВМ80А сравнил

Предлагаю тебе определиться уже, в какую нишу ты пытаешься определить это VLIW недоразумение.

предварительная загрузка данных для команд условия которых еще не вычислены к этому относится

Нет, конечно. Спекулятивное исполнение — это исключительно про исполнение условных команд до проверки условия, и про умение эти команды откатывать в случае миспредикшна.

Просто подгружать команды заранее — это не проблема и в этом нет никакой сложности (или выгоды по части производительности), сложность в том, что делать с тем, что наисполнял, когда бранч оказался неверным.

делают на том, что есть, или ты знаешь какие-то VLIW процессоры на современных тех нормах?

Ммм, интересно, почему так, ведь, как ты утверждаешь, VLIW может посоперничать с ГПУ и ФПГА в производительности. Наверное, потому что VLIW — это тупик, и идустрия пошла по очевидно более эффективному пути: суперскалярный проц + векторные числодробилки при необходимости.

и уж явно там не на FPGA делают

Ну вообще-то делают, интел делает процессоры для числодробления c fpga для серверов, датацентров и проч., и поддерживает их в своих OpenCL драйверах, так что OpenCL код может исполняться на их процах что с GPU, что с FPGA

если речь шла о производительности?

У FPGA и GPU производительность в разы если не на порядки выше, чем у VLIW. У современных Mali на ядро пиковых флопсов больше, чем у Эльбруса 8с целиком на в два раза больших частотах.

Единственное, что в свое время давало DSP какую-то нишу — высокие цены на FPGA и GPU решения.

из статьи 20 летней давности

Где здесь хоть слово про спекулятивное исполнение?

давно суперкомпы стали embeded?

Ниша эльбруса — суперкомпы? В суперкомпах бал уже давно правит GPU, там у него вообще нет шансов.

Так М1 это и есть копеечный RISC, выше постили цену на девборд Эльбруса, он стоит как три макбук air 2020.

обработке сигналов, работы с графикой, они с большим отрывом уделывают и FPGA и CISC

Что? Нет, конечно. DSP уже почти вымерли и вытеснены GPU и FPGA. Я последний раз DSP трогал лет десять назад, когда GPU и FPGA стоили кратно дороже. Сегодня практически весь эмбеддед давно съехал с DSP.

зачатки спекулятивного выполнения уже были в итаниуме

В итаниуме как раз не было спекулятивного исполнения ни в каком виде, он был абсолютно 100% in-order процессором. Поэтому он сходу сливал в производительности не только спаркам и альфам, которые уже сто лет как имели пайплайны, но даже x86 того же времени, которые к тому времени в пайплайны научились.

сливает только там, где он и не должен использоваться - на десктопах

По этой логике он вообще нигде не должен использоваться, потому что в embedded можно взять арм с гпу который уничтожит vliw на любых числодробильных операциях за цену на пару порядков ниже.

33 млрд транзисторов

Это, конечно же, не так. Во-первых откуда там 33млн транзисторов в M1 2020?

У M1 с видео на подложке 16 млрд транзисторов, и они включают расположеный на той же подложке GPU (которые сами по себе больше, чем CPU), neural engine и кучу другой периферии.

против 2,7 млрд у Эльбруса

3.5, у Бачило Эльбрус-8св, + radeon vega 56, раз уж мы все транзисторы на подложке считаем. Примерно сопоставимые процессоры по размеру, у эпол он еще и асимметричный.

вот так выглядит копеечный риск

Ты б еще с контроллером для часов сравнил. Хотя в целом справедливо, эльбрус это просто овердорогой контроллер без периферии и за прайс на несколько порядков выше конкурентов.

они всегда сольют специализированному процу

VLIW это не специализированный проц, это general-purpose проц с статическим пайплайном инструкций. И да, FPGA даже с сильно более низкими частотами уничтожат VLIW на любых задачах тип сортировочных сетей, параллельной арифметики и всем том, чем VLIW в теории может щеголять перед обычным суперскалярным процессором.

вы же там выше агитировали за "копеечный" RISC) а в нем все это максимально упрощено

Где упрощено? Сейчас хорошие пайплайны с реордерингом и спекулятивным исполнением есть в долларовых микроконтроллерах.

и архитектура VLIW предусматривает и аппаратные блоки для оптимизации выполнения

Наоборот, VLIW практически исключает спекулятивное исполнение, потому что блок, умеющий откатывать широкие слова будет архисложным, а штраф за неправильное предсказание ветвления будет чрезмерный.

Поэтому VLIW выполняет инструкции как есть, сливая в производительности суперскалярным процессорам десятилетней давности с допотопным техпроцессом.

в итоге Эльбрус может и свои нативные приложения выполнять (с гораздо большей производительностью)

Это все фантазии. Нативно скомпилированные под эльбрус опенсорсные программы сливают по производительности интелам десятилетней давности с дедовым техпроцессом.

если бы вместо Эльбруса поставили RISC, то Atomic Heart на нем не смогли бы запустить в режиме эмуляции

Чта? Вот Ведьмак работает на лаптопе с A1 арм (чсх с пассивным охлаждением) с трансляцией x86 в арм на лету

https://www.youtube.com/watch?v=G2f-uQ4NzSw

нет конечно, "копеечный RISC" так не сможет

Конечно, сможет, оверхед на трансляцию инструкций околонулевый (на x86 транслятор микрокода дает 3% тепловыделения, у эпол софтварная розетта транслировала инструкции m68k в ppc и x86 в арм с очень низким оверхедом).

Видео, на котором rpi 4 запускает под вайном x86 UT4 на своей встроенной графике через box86.

https://www.youtube.com/watch?v=4VOAeOQcrdo

там эта нагрузка переложена на компилятор

Что сейчас у них пока проблема с хорошимм компиляторами не отменяет что в теории VLIW эффективнее

Компилятор в принципе не способен эффективно реордерить инструкции и предсказывать ветвление, потому что для этого требуется динамическая информация. Для того, чтобы это понять, достаточно заглянуть в любой опенсорсный ЦПУ с пайплайнами, и посмотреть, как происходит реордеринг и предсказание ветвления.

Но компилятора такого ещё нет, не все сразу.

Ага, VLIW существует уже 40 лет, в него вкладывали лярды всякие Интелы и без толку, а фантазеры все фантазируют о волшебном компиляторе, который насчнет эффективно набивать широкие слова статически.

А для военки как раз сплав проца с DSP и нужен

Для военки во сто крат будет проще и эффективнее какой-нить проц с fpga, а чаще даже просто с векторными инструкциями или GPU. Оно и проще для разработчика, и унифицированнее, и дешевле.

2

Если бы их изначально разрабатывали не с упором в предсказание ветвления

Никто не разрабатывает компиляторы "с упором в предсказание ветвления", просто ветвление — это основа любой среднестатистической программы, если только это не массовый поворот полигонов/перемножение матриц (но и там проще просто воткнуть специфичное железо, которое будет много эффективнее, чем VLIW).

И да, компиляторы прекрасно умеют разворачивать циклы и запихивать несколько итераций в векторные инструкции, но это VLIW не сильно помогает, потому что условий все равно слишком много.

Тут именно что проблема в том, что типичная компьютерная программа не ложится на VLIW, а на динамические пайплайны с предсказанием ветвления и реордерингом инструкций ложится отлично (а где не ложится, на гпу, фпга или специфичном железе все равно эффективнее посчитать).

9

В интернете полно инфы

Есть доказательства обратного

Доказательство чего? Есть доказательство того, что Intel, AMD, Transmeta и много кто еще пытались в VLIW, и все эти попытки с треском провалились. Есть бенчмарки Эльбруса, который сливает допотомным x86 процам и чуть ли не распберри пай (и это даже без учета энергопотребления).

23

Использовать RISC, как ни странно, рискованно, т.к. завтра возьмут и какие-нибудь санкции введут

Введут против чего? RISC-V это полностью открытая ISA, бери и делай совместимый процессор, тут никто не может запретить. Да даже ARM и MIPS, вон Китай делает MIPS совместимый Loongson и пофигу вообще. Как можно ввести санкции на ISA вообще?

Чтобы его оптимизировать нужны деньги

Не, деньги нужны, чтоб их в данном случае попилить. Оптимизированный код под VLIW — это миф, что-то про сферических коней и синтетические тесты с перемножением матриц.

В любой реальной программе динамический пайплайн с реордерингом и спекулятивным исполнением всегда будет быстрее статически генерируемых компилятором "широких слов". Пайплайн в процессоре быстрее пайплайна на стороне компилятора.

28

Вот обзор, где запустили Atomic Heart

Ну игра не CPU-bound, и там тормоза в комнате с парой врагов. Здесь на месте эльбруса может быть любой копеечный RISC процессор.

но они не так уж и плохи

Они плохи, VLIW — это тупик, от которого все давно отказались, и который за пределами DSP давно не существует из-за неэффективности. Условный x86, арм или RISC-V процессор всегда будет потенциально эффективнее эльбруса просто за счет возможности спекулятивного исполнения и реордеринга инструкций (причина, по которой на момент выхода, Итаниум оказался медленнее даже современных ему x86 процессоров, которые уже научились в пайплайны как у RISC).

VLIW максимум годится быстро вектор на вектор перемножить, и то он здесь не даст особых преимуществ, ибо во всяких армах для этого просто отдельные инструкции есть.

76

а где там про повестки?

Конкретно, здесь

непередача без уважительной причины паспорта гражданином РФ, право которого на выезд из страны ограничено

Гражданам, подлежащим призыву на военную службу и получившим повестку военного комиссариата, со дня, когда в соответствии с федеральным законом такая повестка считается врученной, запрещается выезд из Российской Федерации. Указанное ограничение действует до исполнения обязанности явиться по повестке в военный комиссариат

В Госдуме одобрили изменения в законе «О порядке выезда из РФ и въезда в РФ»

Если гражданин получает повестку, он должен передать на хранение свой загранпаспорт в миграционный отдел МВД

А помните было такое "не нравится Россия, валите"?

71

как один из самых крутых реформаторов

Возможно, и вошел бы, да, но совершенно несправедливо. Последние адекватные масштабные реформы при Путине — это реформы Грефа, а это начало нулевых (и те свернули).

После реформ Грефа разве что небольшую либерализацию УПК можно припомнить, но это все, то есть Путину просто свалилась идеальная страна в руки с отреформированными институтами, ресурсами, высоким человеческим капиталом и всякими Яндексами, потребительским бумом, а он все просрал.

4

Есть причина, годах в 18-20 за пиратский софт во всяких ниишках сношали только в путь, и центр К себе тогда только так на этом палки делал.

1

Госструктуры наши уже точно на продукты Microsoft не вернутся

Нуну))))))

Ну может какие-то компы-печатные машинки и переведут на линукс, но во всяких ниишках рабочие станции где всякие CAD и проч., почти все поголовно на винде, всякое 1c тоже не всегда есть.

Плюс низкая культура и опять же низкий скилл у админов в таких конторах, потому даже там, где можно было бы заместиться каким-нить KiCAD или еще чем-то, все равно это сделано не будет.

1

Повышая налог уехавшим до 30%, государство на самом деле повышает расходы на оплату труда компаниям

Да, в случае айтишников, которых всякие яндексы держат правдами и неправдами, предлагая переехать в сербию или армению, это так и есть. По факту это ударит по яндексу и другим компаниям, поощряющим релокацию.

1

Вообще никак, заработал ты 450к за месяц, отдал 13%, вот и всё.

Это, конечно же, не так. Открываем базовый учебник экономики (Mankiw — Principles of Economics (2021)) и читаем, что распределение налогового бремени между работником и работодателем зависит исключительно от эластичности рынка труда, и никак не зависит от того, кто формально платит налог: фирма или работник.

Реальный подоходный налог в России — 13/30% + 29%, а уж кто несет его бремя, работник или работодатель (в виде недополученной зарплаты или недополученной выручки), как и везде зависит только от эластичности конкретного рынка труда.

20

И про зарплаты, 60 тысяч – это зарплата обычно ППСника

Ну да, ну да. У ппсников даже в миллионниках зепки 20-30к. Открыл ХХ, Полицейский Росгвардии Москва

стабильная заработная плата от 25 тысяч рублей и более

Про зарплаты следаков тоже лично знаю, также как и зарплаты полицейских уровня подполковника тоже мизерные. Что логично, если даже у ФСОшников зепки такие смешные.

Скажу так, что брать взятки на низах сейчас очень сложно и опасно

Ой все. В стране огромная неувядающая индустрия по чуть ли не торговле военными билетами, продаже мест в очереди на детский сад, в колониях работают колл центры сбербанка, все данные о себе можно купить в даркнете и.т.д., а брать взятки, почему-то, опасно.

Может на уровне совсем уж ППСника или ГАЙца взятку не возьмешь, но чуть-чуть повыше уже мрак.

7