Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)

Описания, советы, ремонт, эксплуатация старых IBM PC-совместимых ПК
Аватара пользователя
Denkixot
Advanced Member
Сообщения: 3100
Зарегистрирован: 06.09.2014,12:11
Откуда: Воронеж

Конкурсы

Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)

Сообщение Denkixot » 06.02.2021,07:25

GentorX
:thumbup:
Цена вещи обратно пропорциональна желанию продавца с ней расстаться!
-----
Клуб Vinyl Breath:
viewtopic.php?f=20&t=35506
Продажа винила:
viewtopic.php?f=28&t=36980
-----
Изображение

wbcbz7
Advanced Member
Сообщения: 437
Зарегистрирован: 17.02.2014,12:24
Откуда: omsk || nsk

Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)

Сообщение wbcbz7 » 07.02.2021,18:15

GentorX писал(а): 05.02.2021,09:07 Вот тут и нарисовано ммх примерно 66.6*8/3 = 177.7 / (1.057 -перевод в мегабайты, но это сопли и погрешность) = 168 мб/с . Для измерений без ммх результат будет в 2 раза меньше т.е. примерно 85.
теперь это объясняет боттлнек при записи в видеопамять (и не только, на самом деле), а я думал что дело в чипсете :). Кстати, это же и объясняет, почему советуют перед последовательной записью большого блока в память вначале сделать холостое чтение в начале кеш-строки, чтобы потом она записалась уже в пакетном цикле с максимальной скоростью:

Код: Выделить всё

вместо:
mov [edi+0], eax
mov [edi+4], ebx
mov [edi+8], eax
mov [edi+12], ebx
...
mov [edi+24], eax
mov [edi+28], ebx

надо вначале сделать, например:
mov cl, [edi]
затем уже запись:
mov [edi+0], eax
mov [edi+4], ebx
mov [edi+8], eax
...

здесь edi выровнен на границу 32 байта

GentorX
Member
Сообщения: 192
Зарегистрирован: 23.12.2017,14:01

Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)

Сообщение GentorX » 07.02.2021,20:04

wbcbz7 писал(а): 07.02.2021,18:15
GentorX писал(а): 05.02.2021,09:07 Вот тут и нарисовано ммх примерно 66.6*8/3 = 177.7 / (1.057 -перевод в мегабайты, но это сопли и погрешность) = 168 мб/с . Для измерений без ммх результат будет в 2 раза меньше т.е. примерно 85.
теперь это объясняет боттлнек при записи в видеопамять (и не только, на самом деле), а я думал что дело в чипсете :). Кстати, это же и объясняет, почему советуют перед последовательной записью большого блока в память вначале сделать холостое чтение в начале кеш-строки, чтобы потом она записалась уже в пакетном цикле с максимальной скоростью:

Код: Выделить всё

вместо:
mov [edi+0], eax
mov [edi+4], ebx
mov [edi+8], eax
mov [edi+12], ebx
...
mov [edi+24], eax
mov [edi+28], ebx

надо вначале сделать, например:
mov cl, [edi]
затем уже запись:
mov [edi+0], eax
mov [edi+4], ebx
mov [edi+8], eax
...

здесь edi выровнен на границу 32 байта
Да, если процессор без ммх,то это будет лучшим вариантом. Однако если есть ммх то не факт. Холостое чтение строки само по себе - примерно 7-9 тактов шины (в лучшем случае) + 7-8 на запись обратно. Выкидывание 4х слов ммх - это 4*3 = 12 тактов. Если же это видеопамять, то чтение из нее может быть на порядок ()в 10 раз) медленнее записи и тут такой трюк не пройдет. Собсно поэтому процессоры ммх и стали любимы, т.к. они давали легкое ускорение мемсру, а не из-за каких-то там мультимедий. :)

wbcbz7
Advanced Member
Сообщения: 437
Зарегистрирован: 17.02.2014,12:24
Откуда: omsk || nsk

Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)

Сообщение wbcbz7 » 07.02.2021,23:02

GentorX писал(а): 07.02.2021,20:04 Собсно поэтому процессоры ммх и стали любимы, т.к. они давали легкое ускорение мемсру, а не из-за каких-то там мультимедий.
так-то и на пнях можно было писать сразу по 64 бита через FPU, правда получалось не настолько быстрее :) а с MMX memcpy я и сам баловался - действительно выходил нехилый буст (правда на PII обычный rep movsd уже был практически на равных)

GentorX
Member
Сообщения: 192
Зарегистрирован: 23.12.2017,14:01

Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)

Сообщение GentorX » 08.02.2021,11:08

FPU при загрузке/выгрузке операндов проверяет и модифицирует их если надо. Использовать его для копирования произвольных данных нельзя, имно. Или это можно отключить как-то?

wbcbz7
Advanced Member
Сообщения: 437
Зарегистрирован: 17.02.2014,12:24
Откуда: omsk || nsk

Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)

Сообщение wbcbz7 » 08.02.2021,18:33

можно копировать через FILD qword ptr/FISTP qword ptr, точности 80бит float вполне хватает. FLD/FSTP работать не будет, тормозя и портя денормалы/NaN

Аватара пользователя
Takedasun
Advanced Member
Сообщения: 3640
Зарегистрирован: 16.10.2013,18:07
Откуда: Керчь

Вклад в сообщество

Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)

Сообщение Takedasun » 26.07.2021,01:30

В продолжении темы viewtopic.php?p=288013#p288013 настройки системы MVP3 на максимальную производительность.

Как оказалось, если после всех оптимизаций заменить одностороннюю планку памяти 128МБ (с которой изначально настраивались система на максимальную производительность), например, на две планки по 64МБ или на одну двухстороннюю планку 128МБ, то Windows, тупо, не загружается :frown:

Аватара пользователя
Rio444
Почётный пользователь
Сообщения: 26861
Зарегистрирован: 14.09.2014,19:11
Откуда: Ростов-на-Дону

Вклад в сообщество

Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)

Сообщение Rio444 » 26.07.2021,10:52

Takedasun писал(а): 26.07.2021,01:30 на две планки по 64МБ или на одну двухстороннюю планку 128МБ, то Windows, тупо, не загружается
Видимо буфера не держат такое количество чипов. Или увеличивать тайминги (возможно хватит и одного, методом перебора), либо возвращать назад одностороннюю 128Мб.
Были ещё 64Мб по 4 чипа.

P.S. Хотя всё может быть гораздо банальнее - почистить ластиком контакты модуля.
Электронка: Изображение копия Изображение

Аватара пользователя
Takedasun
Advanced Member
Сообщения: 3640
Зарегистрирован: 16.10.2013,18:07
Откуда: Керчь

Вклад в сообщество

Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)

Сообщение Takedasun » 01.08.2021,22:46

Rio444 писал(а): 26.07.2021,10:52
Takedasun писал(а): 26.07.2021,01:30 на две планки по 64МБ или на одну двухстороннюю планку 128МБ, то Windows, тупо, не загружается
Видимо буфера не держат такое количество чипов. Или увеличивать тайминги (возможно хватит и одного, методом перебора), либо возвращать назад одностороннюю 128Мб.
Были ещё 64Мб по 4 чипа.

P.S. Хотя всё может быть гораздо банальнее - почистить ластиком контакты модуля.
Позже выяснилось, если не включать параметр DRAM Start Cycle (With cache 66 Mhz) Device 0 Offset 6C, то работают любые планки.

Аватара пользователя
Takedasun
Advanced Member
Сообщения: 3640
Зарегистрирован: 16.10.2013,18:07
Откуда: Керчь

Вклад в сообщество

Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)

Сообщение Takedasun » 21.03.2022,19:50

Только сейчас обратил внимание на низкую скорость работы L2 кэша. На плате ASKA SST-5811 он работает медленнее, чем на ALI Aladdin V и FIC VA-503+ :(
ASKA SST-5811.png
ASKA SST-5811.png (9.74 КБ) 1062 просмотра
Aladdin-V.png
Fic-503.png
Fic-503.png (11.08 КБ) 1062 просмотра
Вроде как все настройки работы L2 кэша выкручены на максимальную скорость :frown:

Аватара пользователя
hcn
Advanced Member
Сообщения: 490
Зарегистрирован: 09.12.2019,01:34
Откуда: Cанкт-Петербург

Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)

Сообщение hcn » 22.03.2022,02:44

BIOS от VA503+ на 5AGM2 показал, что разница в этом:
Device 0 Offset 51 - Cache Control 2
bit 3 SRAM banks
0 - 1 bank (VA503+)
1 - 2 banks (5AGM2)

Ответить